搜索
写经验 领红包

spss单因素方差分析全流程总结怎么做(spss单因素方差分析全流程总结)

导语:SPSS 单因素方差分析全流程总结

案例与数据

在实际生活中,消费者与产品生产者、销售者或服务提供者之间经常发生纠纷。发生纠纷后,消费者常常会向消费者协会投诉。为了对几个行业的服务质量进行评价,消费者协会在零售业、旅游业以及航空公司三个行业抽取不同的企业作为样本,然后统计最近一年消费者对企业的投诉次数(假设企业之间的规模、服务对象等条件都是相同的),一般而言,受到的投诉次数越多,其服务的质量越差。消费者协会想知道这三个行业之间的服务质量是否有显著差异。部分数据如下(数据虚构,无实际意义):

二、分析问题

其实在分析三个行业之间的服务质量是否有差异,实际上也就是要判断行业被投诉的次数是否有显著性差异,差异性分析常见的方法包括方差分析,t检验,卡方检验,由于“行业”是定类数据,“投诉次数”是定量数据,卡方检验中的自变量和因变量均需要满足定类变量,所以使用方差分析或者t检验,又因为定类数据的组别为三个分别为“零售业”、“旅游业”以及“航空公司”,一般两个以上组别需要使用方差分析。所以本例子中使用方差分析进行研究。方差分析包括单因素方差分析和多因素方差分析,因为自变量只有一个(“行业”),所以使用单因素方差分析进行研究即可。

三、分析前准备

首先对数据进行简单查看,比如是否含有异常值等,异常值的存在可能会影响分析结果,所以在分析前需要进行处理,除此之外,进行方差分析还需要满足每个总体服从正态分布,各个总体的方差相同(满足方差齐性),以及观测值是独立的(例子已满足)。所以以下一一来检验。

1.异常值检验

检查数据中的异常值,异常值顾名思义就是同一组别中与其他的值相比相差特别大(比如大于3倍标准差等),异常值的存在会使整体的均值和标准差不准确,可能会导致最终的结果分析,尤其是小样本研究中,例子中共有三组数据,每组15个样本,共有45个样本,所以检查异常值尤为重要。检查异常值的方法有很多,包括利用描述分析进行查看标准差在进行判断,散点图以及箱线图等,其中图示化方法比较直观,所以这里利用SPSSAU可视化的箱线图进行描述:

箱线图结果:

从上图结果可以看出,组别“零售业”以及“旅游业”均有一个异常值,“航空公司”数据未见异常。具体的异常值请见如下:

可以看出“零售业”中数据的异常值为99,“旅游业”中数据的异常值为68。接下来进行筛选处理:

对异常值进行处理后,分别检验数据是否满足方差分析的前提条件,首先进行正态性检验。

2.正态性检验

正态分布的检验方法有很多种,包括正态性检验以及图示法p-p图,q-q图等,一般正态性检验最为严谨所以利用SPSSAU分组进行正态性检验,结果如下:

因为是小样本分析(样本量小于50)所以查看S-W(Shapiro-Wilk)检验结果就可以,如果是大样本数据则可以考虑K-S(Kolmogorov-Smimov)或者J-B(Jarque–Bera)检验。从结果中可以看出三组数据的p值均大于0.05,三组数据具有正态性。若不满足正态性可以使用非参数检验进行分析,接着进行方差齐检验如下。

3.方差齐检验

利用SPSSAU方差齐进行检验结果如下:

从结果中可以看出,三个组别进行方差齐检验,最终F值为2.797,p值为0.073大于0.05,意味着三组数据波动没有太大差异,具有方差齐性。通过分析,发现数据满足方差分析的条件(如果不满足方差齐性,可以使用非参数检验或者welch方差,或者Brown-Forsythe方差),综上满足单因素方差分析条件。

四、单因素方差分析

分析三个行业之间的服务质量是否有差异,以“行业”作为自变量,以“投诉次数”作为因变量进行单因素方差分析,结果如下:

从上表中可以看出,零售业的均值为49.929,标准差为9.068;旅游业的均值为28,标准差为4.315;航空公司的标准差为34.333,标准差为7.451。从中可以看出三者之间有差异,并且零售业投诉次数相对多一些,以及单因素方差模型的F值为34.244,P值远小于0.05,具有显著性差异,也说明了三者之间存在显著性差异。也可以用图示化方法进行描述三者的均值对比:

从折线图中可以看出,例子中“零售业”的均值最大,其次是“航空公司”最后是“旅游业”也即说明“零售业”的投诉比较多,然后是“航空公司”最后是“旅游业”。那么根据单因素方差分析验证三者之间存在显著性差异,具体两两之间的差异如何查看呢?接下来利用事后多重比较分析“两两”之间的关系。

五、事后多重比较

利用SPSSAU事后多重比较中的LSD法(使用最为广泛,检验效能高,对比组别较少)进行两两比较,结果如下:

“零售业”,“旅游业”以及“航空公司”之间两两比较,一共有三组比较,分别为“零售业”和“旅游业”、“零售业”和“航空公司”以及“旅游业”和“航空公司”最后发现三组的p值均小于0.05,所以三个行业两两之间均具有显著性差异。

六、总结

通过搜集的数据进行单因素方差分析发现三个行业之间的服务质量有差异,结合单因素方差分析结果以及折线图发现“零售业”收到的投诉次数相对较多,其次是“航空公司”最后是“旅游业”,然后分析三者中两两行业的关系,在单因素方差分析的基础上,进行事后多重比较发现三个行业中两两之间均具有差异,也说明“零售业”可以更进一步研究“如何提升服务质量”。

免责声明:本站部份内容由优秀作者和原创用户编辑投稿,本站仅提供存储服务,不拥有所有权,不承担法律责任。若涉嫌侵权/违法的,请反馈,一经查实立刻删除内容。本文内容由快快网络小姬创作整理编辑!