两样本定量资料的假设检验.ppt
《两样本定量资料的假设检验.ppt》由会员分享,可在线阅读,更多相关《两样本定量资料的假设检验.ppt(50页珍藏版)》请在三一文库上搜索。
1、6 两样本定量资料的假设检验,王 玖 博 士 副教授 Tel:6913217 E-mail: 滨州医学院卫生统计学教研室,6.1 两组独立样本的假设检验,用来比较两样本所来自的总体均数或总体分布是否相同。 当两样本均来自正态总体且方差齐性时,首选t 检验,可以证明,用 t 检验比较两样本的总体均数是否相同的检验功效是最高的; 当两样本均来自正态总体但方差不齐时,可采用校正的 t 检验。 当两样本并非来自正态总体或总体分布不详时,可采用秩和检验(rank sum test)。,6.1.1 两独立样本的t检验,例6-1 为研究某种新药治疗贫血患者的疗效,将20名贫血患者随机分成两组,一组用新药治疗
2、,另一组用常规药物治疗,测得血红蛋白增加量(g/L)见表6-1。问新药与常规药治疗贫血患者后的血红蛋白平均增加量有无差别?,解析 该例目的在于比较用新药治疗的人群和用常规药治疗的人群的血红蛋白平均增加量(g/L)有无差异,其实质就是比较两个总体均数是否相同,即 是否成立。 在研究设计上,该例属于完全随机设计的两组独立样本。,从两个人群分别随机抽取一定数量的观察资料构成样本,测量某项指标后进行组间比较,属于平行对照设计(成组设计)。 为了研究新生儿窒息患者与正常新生儿血浆中SOD平均含量有无差异,某研究者收集了10名正常新生儿和10名新生儿窒息患者的血浆,测得SOD含量(Nu/mg),请问新生儿
3、窒息患者和正常新生儿血浆中SOD平均含量有无差异?,t检验进行两样本均数比较的步骤,(1)建立检验假设,确定检验水准 :新药和常规药治疗贫血患者后血红蛋白平均增加量相同,即 :新药和常规药治疗贫血患者后血红蛋白平均增加量不同,即 (2)计算检验统计量,当 为真时,两个样本所属的总体均数相等,即 ,此时两个样本资料来自相同的总体,两个样本均数都是该总体均数的点估计值,样本均数与总体均数的差是样本均数的抽样误差,故两个样本均数均随机地出现在 附近, 仅是样本均数的抽样误差,这时相应的成组 t 检验统计量 一般也很小或比较小;,当 非真时,两个样本的总体均数不相等,即, ,两个样本均数分别为两个总体
4、均数的点估计值,它们均随机地出现在各自的总体均数附近,由于两个总体均数不等,故此时两个样本均数差异相对较大,其相应的成组 t 检验统计量 一般会较大或很大。,(3)查t界值表,得P0.05, 按 0.05水准拒绝 ,接受 ,可以认为新药和常规药治疗贫血患者后血红蛋白增加量不同,根据样本均数的信息 ,认为 ,即服用新药后血红蛋白含量平均增加量高于常规药。,(4)均数之差的置信区间 根据t检验中拒绝 的结论结合 的95%置信区间(3.829, 11.731),也可推断用新药治疗患者的血红蛋白平均增加量高于常规药治疗的患者,6.1.2 校正的t检验 (方差不齐),数据的正态性和方差齐性是t 检验的前
5、提条件;如果两样本所属总体均为正态,但方差不齐,则应采用 作为检验统计量,自由度也要校正。,例6-2 为探讨硫酸氧钒对糖尿病性白内障大鼠血糖的影响,研究人员将已诱导糖尿病模型的100只大鼠随机分为两组,实验组给予硫酸氧钒治疗,对照组为空白对照。结果如下,,试问两种处理疗效的总体均数是否相同?,校正t检验的统计量为,当,为真时,统计量 的临界值近似地等于自由度为 的 t 分布 的临界值,当 时,对于 为真而言,这是一个小概率事件,在一次随机抽样中一般是不会发生的,有理由怀疑“ 为真”,故可以拒绝 ,认为两个总体均数不等。,6.1.3 方差齐性检验和正态性检验,(3)确定P值,判断结果,6.1.3
6、.2正态性检验,对于大样本资料(如n50),样本均数近似地服从正态分布,故满足成组检验关于正态分布的要求; 但当样本例数较小时,需要对每组资料进行正态性检验。常用的正态性检验方法是矩法检验和w检验(Shapiro-Wilk W test),矩法检验比较保守,w检验比较灵敏。此外,还有K-S检验(Kolmogorov-Smirnov test)和D检验(D test)等。 正态性检验的无效假设为资料服从正态分布,备择假设为资料不服从正态分布。,6.1.4 两组独立样本的秩和检验,例6-3 某医师为研究血铁蛋白与肺炎的关系,随机抽查了肺炎患者和正常人若干名,并测得血铁蛋白(g/L)含量,问肺炎患者
7、与正常人平均血铁蛋白含量有无差别? 肺炎患者 31 68 237 174 457 492 199 515 599 238 正常人 177 172 34 47 132 54 47 52 47 294 68 43 277 44 43 95,正常人组 正态性的W检验结果P=0.010,参数统计-非参数统计,在统计推断方法中,凡是在已知总体分布的前提下对总体参数进行估计或检验的方法,称为参数统计(parametric statistics)。 但在实际工作中,有时总体的分布不易确定,或分布不符合要求的条件,则需要应用一种不依赖于总体分布类型的统计推断方法,称为非参数统计(nonparametric s
8、tatistics)。Wilcoxon秩和检验属于非参数检验中的一种,可以用于完全随机化设计两组独立样本的比较。,非参数统计的基本思想,在不知总体分布的情况下如何利用数据所包含的信息呢?一组数据的最基本信息是次序,将数值按大小次序排队,每个数值在整个数据中均有相应的位置和次序,称为该数据的秩(rank)。 在一定的假设下,这些秩及其统计量的分布是可以求出来的,且与原来的总体分布无关,可进行所需要的统计推断。,Wilcoxon秩和检验基本步骤,(1)建立检验假设 :肺炎患者与正常人的血铁蛋白总体分布相同 :肺炎患者与正常人的血铁蛋白总体分布不同 =0.05 (2)计算检验统计量T值 编秩将两组数
9、据合起来由小到大统一编秩,即从小到大编号,最小的数据的秩为1,第二小的 数据的秩为2,依此类推。编秩时如遇有相同数据,且相同数据在不同组时,要取其平均秩次 (3)确定P值,作出统计推断结论,查表法 T界值表(两样本比较的秩和检验用),先从左侧找到较小的样本量,本例较小的样本量为n1=10;再从表上方找两组例数的差,本例,n2-n1=6;在两者纵横交叉处即为T的界值。 将检验统计量T1值与T界值相比,若T值位于界值范围内,其P值大于相应的概率;若T值等于界值或在界值范围外,其P值等于或小于相应的概率。 正态近似法,相持较多时的校正,tj为第j (j=1,2)个相持所含的个体数,Wilcoxon秩
10、和检验的基本思想,秩次在一定程度上反映了等级的高低; 秩和在一定程度上反映了等级的分布位置,这样,对观察值的分析就转化为对秩次的分析。 当H0为真时,两个样本来自相同的总体,对于样本量为n1和n2而言,每个数据的秩均有相同的机会取值为1,2,n1n2,因此每个数据的秩次期望值为(n1+n2+1)/2 。第一组的n1个数据的秩和T1应随机地出现在其期望值 n1(n1+n2+1)/2 附近。,H0为真时,第一组的秩和T1在其期望值n1(n1+n2+1)/2处呈对称分布,并且当样本量较大时,统计量秩和T1近似服从均数为n1(n1+n2+1)/2,方差为n1n2(n1+n2+1)/12的正态分布; H
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 样本 定量 资料 假设检验
链接地址:https://www.31doc.com/p-2980398.html