《方差分析研2012-1.ppt》由会员分享,可在线阅读,更多相关《方差分析研2012-1.ppt(70页珍藏版)》请在三一文库上搜索。
1、2019/6/3,1,Analysis of variance,第十章,方差分析,黄志刚 公共卫生学院 流行病与统计教研室,2019/6/3,2,例: 某医生为研究一种降糖新药的疗效,以统一的纳入标准和排除标准选择了60名2型糖尿病患者,按完全随机设计方案将患者分为三组进行双盲临床试验。其中,降糖新药高剂量组21人、低剂量组19人、对照组20人。对照组服用公认的降糖药物,治疗4周后测得其餐后2小时血糖的下降值(mmol/L),结果如表9-1所示。 问治疗4周后,餐后2小时血糖下降值的三组总体平均水平是否不同?,2019/6/3,3,2019/6/3,4,不能用t检验分析两组以上多个均数的比较,
2、1、与资料最初的设计要求不符 2、增加犯第一类错误的概率,2019/6/3,5,2019/6/3,6,实例演示,从已知正态总体N(10,52)随机抽取10个样本(ni=10)的结果,2019/6/3,7,45次比较中5次有统计学意义的结果,实际犯第一类错误的概率:5/45=0.11,2019/6/3,8,Analysis of Variance ( ANOVA)由英国统计学家R.A.Fisher首创,为纪念Fisher,以F命名,故方差分析又称F 检验 (F test)。用于推断多个总体均数有无差异.,2019/6/3,9,方差分析的含义 方差是描述研究对象变异程度的一种指标 方差分析是一种假
3、设检验的方法,就是对变异的分析 用于两组或两组以上多个均数之间的比较,第一节 方差分析的基本思想和应用条件,2019/6/3,10,例:某研究者为研究煤矿粉尘作业环境对尘肺的影响,将24只Wistar 大鼠随机分到甲、乙、丙三个组,每组8只, 分别在地面办公楼、煤炭仓库和矿井下染尘,12周后测量大鼠全肺湿重,三组大鼠的全肺湿重有无差别?,2019/6/3,11,样本均数的差异,可能有两种原因所致: 1、可能由随机误差所致,随机误差包括两种成分个体间的变异和测量误差两部分; 2、可能是由于各组所接受的处理不同,不同的处理引起不同的作用和效果,导致各处理组之间均数不同。,2019/6/3,12,方
4、差分析的基本思想: 将所有观察值之间的变异(称总变异)根据离均差平方和划分的原理,按设计和需要分解成两个或多个部分。每一部分变异都反映了研究工作中某种特定的内容(如某种处理因素的作用、随机误差的影响等),通过对平均变异的比较,做出相应的统计判断。,2019/6/3,13,总变异(Total variation):全部测量值与总均数 间的差别 组间变异( between group variation ) 各组的均数 与总均数 间的差异 组内变异(within group variation )每组的8个测量值(观察值)与该组均数 的差异,2019/6/3,14,24只大鼠的全肺湿重大小各不相等
5、,它们之间的变异称为总变异。 用每个观察值与总均数的离均差平方和来表示,称为总离均差平方和SS总,1.总变异,SS组间反映了各组均数 间的变异程度 组间变异随机误差+处理因素效应,2. 组间变异,在同一处理组内,虽然每个受试对象接受的处理相同,但测量值仍各不相同,这种变异称为组内变异。 SS组内仅仅反映了随机误差的影响。也称SS误差,3. 组内变异,m i,三种“变异”之间的关系,均方(mean square,MS),均方之比F 值,2019/6/3,20,方差分析的检验假设: H0:为各样本来自均数相等的总体 H1:为各总体均数不等或不全相等 如果组间变异与组内变异相等,两者的比值即统计量F
6、为1;由于存在抽样误差,两者往往不恰好相等,但相差不会太大,统计量F应接近于1。因此不拒绝H0,可认为各样本均数间的差异,是由于抽样误差所致,而不是由于处理因素的作用所致。,2019/6/3,21,如果各样本均数间的差异,不仅是由抽样误差所致,还有处理因素的作用。此时的组间变异远大于组内变异,两者的比值即统计量F 明显大于1。因此就要拒绝H0,接受H1,可认为各样本均数间的差异,并不是由于抽样误差所致,而是处理因素的作用。,2019/6/3,22,F值要大到何种程度才有统计学意义呢? 即,F值要大到何种程度才能认为各组均数间的差异是由处理因素引起而非随机误差呢? 可以通过查F界值表,确定P值作
7、出统计推断 附表7(F界值表)P341,F 界值表,附表7 F界值表(方差分析用,单侧界值) 上行:P=0.05 下行:P=0.01,7,2019/6/3,24,2019/6/3,25,2019/6/3,26,方差分析的基本思想 将总变异分解为组间变异和误差(组内)变异,然后比较两者的均方,即计算F值,若F值大于某个临界值,表示处理组间的效应不同,若F值接近1时,表示处理组间效应相同(差异仅仅由随机原因所致)。 对于不同设计的方差分析,其基本思想都一样,即均将处理间平均变异与误差平均变异比较。不同之处在于变异分解的项目因设计不同而异。,2019/6/3,27,方差分析的应用条件: 各样本须是相
8、互独立的随机样本(独立性) 各样本来自正态分布总体(正态性) 各总体方差相等(方差齐性),2019/6/3,28,2019/6/3,29,正态分布的判断方法 利用频数表或频数图进行判断 根据专业知识判断:疾病的潜伏期、住院天数和 临床生化指标大多为偏态 经验判断 若 ,可认为资料呈偏态分布 若 ,则有理由怀疑资料呈偏态分布 正态性检验(W检验、D检验),2019/6/3,30,方差齐性的判断方法 经验判断 S2MAX/ S2MIN5,认为方差不齐; 否则认为方差齐性。 方差齐性检验,2019/6/3,31,方差分析的用途: 两个或多个样本均数间的比较 分析两个或多个因素间的交互作用 回归方程的
9、线性假设检验 多元线性回归分析中偏回归系数的假设检验 两样本的方差齐性检验等,2019/6/3,32,第二节 完全随机设计的方差分析,完全随机设计(completely random design) 又称成组设计 在实验研究中,按随机化原则将受试对象随机分配到某一研究因素的多个水平中去,然后观察实验效应; 在调查研究中,按一个研究因素的不同水平分组,比较各组的效应。,2019/6/3,33,临床研究中,还可能遇到: 比较几种不同疗法治疗某种疾病后某指标的变化,以评价它们的疗效; 比较某种疾病不同类型之间某一指标有无差别等 均属于一个因素不同水平间几个样本均数的比较,可用单因素的方差分析(one
10、-way ANOVA)来处理此类资料。,2019/6/3,34,处理(研究)因素和水平 研究因素:血型 不同水平:A B AB O 处理因素:药物 不同水平:同一药物的不同剂量 不同药物 判断原则: 在统计学上,仅当实验条件有2种或2种以上的具体表现时,才称其为“因素”,其具体表现称为“水平”。,2019/6/3,35,例题,2019/6/3,36,随机分组方法: 1. 编号,确定分组方案(如较小12个随机数为A组,中间12个数为B组,较大12个随机数为C组) 2. 产生随机数字(查表或电脑),排序 3. 按方案分组,2019/6/3,37,方差分析的步骤,建立假设 H0: 1=2=3(三组大
11、鼠NO含量总体均数相等) H1:1、2、3不等或不全相等 a=0.05,2019/6/3,38,计算统计量,2019/6/3,39,列出方差分析表,2019/6/3,40,做出统计推断: 查附表7可知,本例F=5.564F0.015.32,P0.01。 按a=0.05水准,拒绝H0 ,接受H1 ,认为三组的差别具有统计学意义,即可以认为三组的NO水平不同或不全相同。,2019/6/3,41,第三节 随机区组设计的方差分析,2019/6/3,42,随机区组设计 randomized block design,又称为配伍组设计,是配对设计的扩展。具体做法是:先按影响试验结果的非处理因素(如性别、体
12、重、年龄、职业、病情、病程、动物窝别等)将受试对象配成区组(block),再分别将各区组内的受试对象随机分配到各处理或对照组,2019/6/3,43,随机区组设计的特点 是随机分配的次数要重复多次,每次随机分配都对同一个区组内的受试对象进行,且各个处理组受试对象数量相同,区组内均衡。,2019/6/3,44,2019/6/3,45,2019/6/3,46,2019/6/3,47,变异分解 总变异: 所有观察值之间的变异 处理间变异:处理因素随机误差 区组间变异:区组因素随机误差 误差变异: 随机误差,2019/6/3,48,随机区组设计总变异SS总和处理组间变异 SS组间的计算与完全随机设计的
13、方差分析相同 SS区组 的计算:,2019/6/3,49,数理统计上可以证明,随机区组设计的总变异和自由度可以分解为三部分:,2019/6/3,50,2019/6/3,51,随机区组设计方差分析的步骤,1、建立假设,确定检验水准 对于处理组 H0: 1=2=3(即3种营养素对小白鼠体重增加作用相同 ) H1:1、2、3不等或不全相等 a=0.05 对于区组 H0: 十个区组的总体均数相等 H1:十个区组的总体均数不等或不全相等 a=0.05,2019/6/3,52,2019/6/3,53,2019/6/3,54,2019/6/3,55,随机区组设计的方差分析 总变异 和完全随机设计的方差分析相
14、比,误差减小了,统计检验效率提高了。,处理组间变异,区组间变异,误差,组内变异,2019/6/3,56,第四节 多个样本均数的两两比较,常用的两种方法: SNK(Student-Newman-Keuls)检验 也称q检验,适用于探索性研究,对任意两个样本均数都进行检验。 LSD-t (least significant difference)最小显著性差异检验 适用于多个处理组与对照组的比较,或某几个处理组间的比较。,2019/6/3,57,SNK-q 检验 检验统计量q的计算公式为:,式中 为两个对比组的样本均数, 是方差分析中的误差均方(或组内均方), 为两对比组的样本例数。 v误差 为方
15、差分析中误差均方的自由度。,2019/6/3,58,例:某研究者为研究煤矿粉尘作业环境对尘肺的影响,将24只Wistar 大鼠随机分到甲、乙、丙三个组,每组8只, 分别在地面办公楼、煤炭仓库和矿井下染尘,12周后测量大鼠全肺湿重,三组大鼠的全肺湿重有无差别?,2019/6/3,59,2019/6/3,60,2019/6/3,61,2019/6/3,62,2019/6/3,63,3.确定P值,做出统计推断 q界值不但考虑自由度,而且考虑组数a ,即任意两对比组包含的组数。以组数a 和 查附表8(q 界值表)。,2019/6/3,64,LSD-t检验 适用于多个处理组与对照组的比较,或某几个处理组间的比较,一般在设计阶段确定哪些均数需进行多重比较。 检验统计量t值的计算公式为:,2019/6/3,65,2019/6/3,66,2019/6/3,67,2019/6/3,68,2019/6/3,69,2019/6/3,70,小 结,方差分析的基本思想 完全随机设计方差分析 随机区组设计方差分析 多个样本均数的两两比较方法: SNK(Student-Newman-Keuls)q检验 LSD-t (least significant difference)最小显著性差异检验,
链接地址:https://www.31doc.com/p-2905490.html