第8章方差分析.ppt
《第8章方差分析.ppt》由会员分享,可在线阅读,更多相关《第8章方差分析.ppt(82页珍藏版)》请在三一文库上搜索。
1、第8章 方差分析,管理统计学 谢湘生 广东工业大学管理学院,引例 哪种促销方式最好?,某连锁超市公司为了研究不同促销手段对商品销售额的影响,选择了某类日常生活用品在其属下的5个门店分别采用某种促销方式各进行了4个月的试验,实验前该类商品在这5个门店的销售额基本处于同一水平。试验结果见表,其中“通常促销”是指不采用任何促销手段,“广告宣,传”是指没有价格优惠的单纯广告促销,“买一送一”是指买一件商品送另一件小商品。现该公司希望了解的是: (1)不同的促销方式是否对该类商品销量的增长有显著影响? (2)若有显著影响,哪种促销方式效果最好? (3)是否任意两种促销方式的效果之间都存在显著差异? 掌握
2、以上信息对该公司制定今后的最佳销售策略,有非常重要的意义?,8.1 单因素方差分析,方差分析(Analysis of Variances, 简记为ANOVA)可以一次对多个总体完成均值是否相同的检验。,我们先讨论单因素方差分析,8.1.1 问题的提法,设对于s个不同的技术方案,分别进行了ns个实验来检验其效果,记方案i的第j个实验的结果为xij,问题是:如何判别这些方案的效果之间是否存在显著区别?,从统计的观点只需要检验各方案的平均效果i之间是否存在显著区别即可。,单因素方差分析的数据通常可以采用如下的表格方式列出,单因素方差分析虽然起源于对技术方案的评价,但现在它也被用来解决许多具有不同的实
3、际背景的问题。,例如,方案,政策、设备、方法、药品、工艺、原料,实验,调查、检验、观察、检查、测试,所谓“单因素”,就是指分析中只有“方案”这个单一的因素(变量),不同的方案,就是“方案”这一变量的不同取值。这些不同的取值也可以认为是“方案”这个因素的不同水平。,因素或变量的不同取值或水平,对应同一水平的不同观察值或样本值,xij, 下标i对应单一因素的第i个水平,下标j对应第j个样本观察值,8.1.2 理论假设与分析,假设这s个方案的总体都服从正态分布:N(i, 2), 这意味着这些总体都有相同的方差,但均值可能互不相同。,1,2,3,随机样本Xij,可以看成各个方案的总体均值i与随机误差i
4、j之和:,其中ij N(0, 2), 并且如果对不同方案进行的不同实验都是独立进行的话, ij之间也是相互独立的。,如果表示实验效果的数据都是一元的,则称上述模型为单因素(一元)方差分析的统计模型。相应地,若表示效果的实验数据是多元的,就称为单因素多元模型。,ij,i,Xij,上述模型中的随机误差可以表示为:,但我们并不能观察到总体的均值i,在实际应用时,可以通过样本均值 来估计它,也就是用,来估计(观察)真实的误差ij 。,样本均值组内平均(第2组):,样本总平均:,总平均:,方案i的主效应:,由单因素的方差分析模型 和上式,有,即Xij可以表示为总平均、方案i的主效应与随机项之和。,由各方
5、案的主效应的表达式知,若对于所有的i都有ai = 0,则各方案的均值相同(都等于)。,所以单因素方差分析的基本任务就是检验如下的假设:,原假设 H0:ai = 0 或 1= 2= s,备择假设 H:ai 不全为 0 或 1,2, s中 至少有两个不相等,单因素方差模型构成表,8.1.3 实际作法,按照Xij的构成:,可以看到Xij与总的平均水平的偏差由两部分构成:,通常用Xij与总的平均水平的偏差的平方和, 来反映各Xij与总平均水平的整体波动, 记为ST。但与i是观察不到的,所以用相应的样本观察值代替,并且用 代替真实的误差ij 。因此,可以证明如下的平方和分解公式:,也就是总的偏差(波动)
6、可分解为,组间变差各方案效果差别导致的偏差。,组内变差随机因素导致的偏差。,证明见庄楚强等编应用数理统计基础,华南理工大学出版社。,实际上,SA既包括了各方案效果差异导致的系统误差,也包括随机误差;而SE仅包括随机误差。,也就是, 观察值之间的差异来自两个方面:,某因素不同水平的影响 (系统性影响),其他随机因素的影响 (随机性影响),水平间方差 (组间方差),水平内方差 (组内方差),于是,若假设H0满足,应该有比值:,就不会太大,否则就表明H0不成立。,此外容易说明相应的F统计量(即将f中的各xij换成Xij后得到的统计量)服从分布F( s 1 , n s )。从而F可以作为检验统计量。对
7、给定的显著性水平, 可以求得临界值f(s 1 , n s), 若f f, 则拒绝H0。,实际算法:,(1)先计算组间变差,(2)再计算组内变差,(3)计算统计值,(4)检验,对给定的显著性水平, 可以求得临界值f (s 1 , n s), 若f f, 则拒绝H0;否则不拒绝H0。,注意:,(2)在拒绝H0时,我们仅仅能断定至少有两个方案之间的平均效果(均值)存在显著差异,但是到底哪些方案之间有显著差异,哪些之间没有,则无法判定。如果要知道这一结果,理论上应当采用第6章的方法,对不同方案做两两对比,也就是进行多个组合之间的对比检验。完全进行所有比较需要进行 次检验。幸亏这可由SPSS自动完成。,
8、(1)这里的检验是单尾检验。直观地看,当H0不满足时,SA 相对于SE而言总是比较大的,因此我们只会在f比较大时拒绝H0。,因此,在进行方差分析时,按如下的处理方式:,不拒绝H0,表示拒绝总体均数相等的证据不足,拒绝H0,接受H1, 表示总体均数不全相等,分析终止。,需要进一步作多重比较,多重比较方法,我们看到,当多个总体的方差相等时,我们既可以进行方差分析,也可以将这些总体两两进行逐对比较。 相比之下,方差分析除了前面提到的可以更好的估计方差之外,其另外的一个好处是可以降低犯第一类错误的概率。 以引例的分析为例,在那里,我们通过方差分析比较5个总体的均值是否相等,设定的犯第一类错误的概率为0
9、.05.,多重比较方法,如果我们将这5个总体两两配对进行比较,则需要作10个两总体均值差的假设检验。 若这10个配对假设检验所设定的犯第一类错误的概率(又称为比较性犯第一类错误的概率)均为0.05;则这10次检验中至少有一次犯第一类错误的概率为 1-(1-0.05)10=0.40. 称这个概率为总的或试验性犯第一类错误的概率。,因此对多个总体的均值比较问题, 通常不会用两两比较的t检验来代替方差分析.,若 拒绝H0;否则若 不拒绝H0。,8.1.4 用统计值 f 的显著性概率p与比较,进行检验,在利用计算机软件来做方差分析时,软件通常会给出统计值 f 的最低显著性水平p,这时可根据p值的大小进
10、行检验:,f,f,实际上,是过f 的直线截得分布曲线下方右边的面积,若 则表明,8.2 用SPSS作单因素方差分析,8.2.1 选用系统默认选项的操作示例,数据:教材数据光盘中的“CH4CH8茎叶箱方差工资性别岗位300余”,步骤: (1)点击AnalysisCompare Means One-way ANOVA,(2) 选左框中的变量:“当前工资”,用箭头送入右边Dependent list(因变量列表)框中,(3) 选左框中的变量:“工作性质”,用箭头送入右边Factor(因素变量)框中,(4)点击OK,SPSS就给出分析结果。,SA,SE,p,结果说明:由于计算得到的p值=0.000.0
11、5。因此对给定的显著性水平 = 0.05,应该拒绝原假设,也就是:不同工作性质的工资存在显著区别。,8.2.2 使用选项的操作示例,数据:教材数据光盘中的“CH4CH8茎叶箱方差工资性别岗位300余”,步骤: (1)点击AnalysisCompare Means One-way ANOVA,(2) 选左框中的变量:“当前工资”,用箭头送入右边Dependent list(因变量列表)框中,(3) 选左框中的变量:“工作性质”,用箭头送入右边Factor(因素变量)框中,(4)指定选项:,点击Option按钮,机器弹出一个对话窗口,在该对话窗口中Statistics选项中,选择Homogenei
12、ty-of-variance复选项,表示进行方差齐次性检验。,在Missing Values选项中,选择Exclude cases analysis by analysis选项,表示只剔除正在分析的组内的缺失值(这是系统默认选项)。,然后按Continue返回上一窗口。,(这意味着如果拒绝H0,则也无须再保证各总体有同样的方差),点击Post Hoc按钮,系统弹出Post Hoc Multiple Comparison(各组均值两两比较)窗口。,在Equal Variance Assumed(齐次方差假设)选项中选择LSD, 其含义是,即通过t检验,来对比检验组中两两均值是否存在显著差异,不进
13、行两两均值的误差调整。,再在Equal Variance Not Assumed(非齐次方差假设) 选项中选择TamHanes T2。其含义是,然后点击Continue返回上一窗口。,点击Contrasts(对照)按钮,弹出Contrasts对话窗。,选择Polynomial激活Degree列表框,选择Linear(默认值).,然后在框Coeffcients,依次Add进行对比的各组系数(每输入一组系数以后,Next按钮激活,点击它可再输入下一组系数)。,输入完后点击Continue返回上一窗口。注:如果不需要进行特定的对比检验,就无须进行该项选择。,最后点击OK,SPSS就可输出结果。,关于
14、引例的方差分析,1.在SPSS中先建立一个数据文件,文件中包含两个变量:销售额,促销方式。 2.其中“促销方式”取值分别为: 1, 2, 3, 4, 5。分别对应着5种促销方法。再将所有销售数据送入变量,相应地确定“促销方式”的取值。 3.调用SPSS的单因素方差分析的功能进行方差分析,步骤同上例。,8.3 无重复实验的双因素方差分析,8.3.1 问题的提出,例如下面的问题:,对运动员训练的效果不但与训练方法有关,也与运动员的身体素质有关。如果选出了n组运动员,每个组的运动员有同样的体质特征,每个组有s个运动员,用s种不同方法进行训练,这样可以获得sn个不同的训练效果,怎样判断不同的方法训练效
15、果是否有显著差异?不同体质特征对训练效果是否有显著影响?,实际问题中影响实验效果的因素可能不只一个,现在考虑有两个影响因素的情形。,问题的有关条件可以概括成如下的表,其中xij表示因素Ai和因素Bj下的实验效果的观察值,问题,因素A的不同水平(方案)的效果(均值)有无显著不同?,因素B的不同水平(方案)的效果(均值)有无显著不同?,所谓“双因素”,是指问题中有两个(反映前提或条件的)变量(因素):变量A和变量B。Ai是变量A的一个取值(又称因素A的一个水平),Bj是变量B的一个取值(又称因素A的一个水平)。,双因素问题在经济管理中是常见的。上述运动员训练的问题明显可以应用于: 不同水平(层次)
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 方差分析
链接地址:https://www.31doc.com/p-2501537.html