第3章定性数据的卡方检验.ppt
《第3章定性数据的卡方检验.ppt》由会员分享,可在线阅读,更多相关《第3章定性数据的卡方检验.ppt(62页珍藏版)》请在三一文库上搜索。
1、第三章,定性数据的卡方检验,在各个研究领域中,有些研究问题只能划分为不同性质的类别,各类别没有量的联系。例如,性别分男女,职业分为公务员、教师、工人、,教师职称又分为教授、副教授、。有时虽有量的关系,因研究需要将其按一定的标准分为不同的类别,例如,学习成绩、能力水平、态度等都是连续数据,只是研究者依一定标准将其划分为优良中差,喜欢与不喜欢等少数几个等级。对这些非连续等距性数据,要判别这些分类间的差异或者多个变量间的相关性方法称为计数数据统计方法。,机动 目录 上页 下页 返回 结束,H0(无效假设):总体参数没有差别,机动 目录 上页 下页 返回 结束,2检验,用途:分类计数资料的假设检验,检
2、验两个或多个总体率或构成比有无差别。,基本思想:实际频数与理论频数的符合程度,即差别是否由抽样误差引起的。,检验统计量:,2用来反映各类中实际观测到的实际频数与一定假设下的理论频数的偏离程度. 永远是正值.,实际频数通过实际观测或实验得到, 理论频数要按照统计假设计算出来.,第三章,第一节,机动 目录 上页 下页 返回 结束,卡方拟合性检验,第三章,第一节,机动 目录 上页 下页 返回 结束,卡方拟合性检验,一、卡方检验的一般问题,卡方检验应用于计数数据的分析,对于总体的分布不作任何假设,因此它又是非参数检验法中的一种。,理论证明,实际观察次数(fo)与理论次数(fe),又称期望次数)之差的平
3、方再除以理论次数所得的统计量,近似服从卡方分布,可表示为:,机动 目录 上页 下页 返回 结束,K为组数, r为待估参数个数.,有所改变.,分布的概率密度图形如下:,当fe越大( fe 5), 近似得越好。,显然fo与fe相差越大,卡方值就越大; fo与fe相差越小,卡方值就越小;因此它能够用来表示fo与fe相差的程度。,机动 目录 上页 下页 返回 结束,拟合性检验自由度的确定与两个因素有关:一是分类的项数,二是在计算理论次数时,所用统计量或约束条件的个数,这两者之差即为自由度。,由于一般情况下,计算理论次数时只用到“总数”这一统计量,所以自由度一般是分类的项数减1。,拟合性检验的零假设是观
4、测次数与理论次数之间无差异。,机动 目录 上页 下页 返回 结束,可认为卡方检验的一般问题是要检验名义型变量的实际观测次数和理论次数分布之间是否存在显著差异。,卡方检验能检验单个多项分类名义型变量各分类间的实际观测次数与理论次数之间是否一致的问题,这里的观测次数是根据样本数据得到的实计数,理论次数则是根据理论或经验得到的期望次数。这一类检验称为拟合性检验。,二、检验无差假设,无差假设: 指各项分类的实计数之间没有差异,也就是说各项分类之间的概率相等(均匀分布),因此理论次数完全按概率相等的条件来计算。,任一项的理论次数都等于总数/分类项数。,机动 目录 上页 下页 返回 结束,自由度也就等于分
5、类项数减1。,例1 随机地将麻将色子抛掷300次,检验该色子的六个面是否均匀。结果1-6点向上的次数依次是,43,49,56,45,66,41。,解:每个类的理论次数是 300/6 = 50,代入公式:,机动 目录 上页 下页 返回 结束,因此,在0.05的显著性水平下,可以说这个色子的六面是均匀的。,例2 随机抽取60名高一学生,问他们文理要不要分科,回答赞成的39人,反对的21人,问对分科的意见是否有显著的差异。,解:如果没有显著的差异,则赞成与反对的各占一半,因此是一个无差假设的检验,于是理论次数为60/2=30,代入公式:,机动 目录 上页 下页 返回 结束,所以对于文理分科,学生们的
6、态度是有显著的差异的。,例 某商场统计了一周中七天的顾客平均数如下表所示,请问该商场一周各天的顾客数是否有显著性差异?,机动 目录 上页 下页 返回 结束,三、检验假设分布的概率,这里的假设分布可以是经验性的,也可以是某理论分布。公式中所需的理论次数则按照这里假设的分布进行计算。,机动 目录 上页 下页 返回 结束,例3国际色觉障碍讨论会宣布,每12个男子中,有一个是先天性色盲。从某校抽取的132名男生中有4人是色盲,问该校男子色盲比率与上述比例是否有显著差异?,解:按国际色觉障碍讨论会的统计结果,132人应该有132/12=11人是色盲,剩下的121人非色盲,代入公式有:,机动 目录 上页
7、下页 返回 结束,因此,在0.05和显著性水平下,该校男子色盲比率与国际色觉障碍讨论会的统计结果有显著差异,显然根据比例可知该校的色盲率小于国际色觉障碍讨论会的统计结果。,例 教务处要求各院系在本科生毕业设计的成绩评定中,注意成绩等级的人数分布,一般应符合如下表格中第一行所示的比例 。某院65名本科生毕业设计成绩等级分布如下表第二行数字。请问该院系学生毕业设计的成绩评定是否符合学校要求?,机动 目录 上页 下页 返回 结束,例4 在英语四级考试中,某学生做对了80个四择一选择题中的28题,现在要判断该生是否是完全凭猜测做题。,解:假如该生完全凭猜测做题,那么平均而言每道题做对的可能性是1/4,
8、因此80个题中平均而能做对80/4=20题,代入公式有:,机动 目录 上页 下页 返回 结束,因此,该生可能会做一些题。 。,例5.某电话交换台,在100分钟内记录了每分钟被呼唤的次数X,设f i为出现该 X值的频数,结果如下:,问总体X(电话交换台每分钟呼唤次数)服从泊松分布吗?,解:,按题意,原假设,由于未知,首先须用极大似然估计法,求得的估计值:,检验统计量:,拒绝域:,列表计算:,1 2 3 4 5 6 7 8,n=100,7 12 18 17 20 13 6 7,1.3099,-0.02 -0.34 0.18 -2.29 3.30 0.95 -1.46 -0.32,0.00006 0
9、.0094 0.0018 0.2719 0.6521 0.0749 0.2857 0.0140,7.02 12.34 17.82 19.29 16.70 12.05 7.46 7.32,0.0702 0.1234 0.1782 0.1929 0.1670 0.1205 0.0746 0.0732,因为,所以接受H0,,认为电话交换台每分钟呼唤次数X 服从泊松分布.,说明:,将n=0和n=1合并,n=8与n9合并是为了,保证理论频数npi 4.,四、连续变量分布的拟合性检验,首先要将测量数据整理成次数分布表和画出次分布图,并据此选择恰当的理论分布。,机动 目录 上页 下页 返回 结束,然后根据选
10、择的理论分布计算出理论次数,就可以计算卡方统计量并进行显著性检验了,例5.为了研究患某种疾病的2159岁男子的血压(收缩压,单位:mm-Hg )这一总体X,抽查了100个男子,得 , ,样本值分组如下:,取=0.10,检验2159岁男子的血压(收缩压)总体X是否服从正态分布。,解:,按题意,原假设,由于,2未知,首先须用极大似然估计法,求得其估计值(看教科书七章二节例2):,检验统计量:,拒绝域:,列表计算:,H0为真时,,列表计算:,1 2 3 4 5 6 7 8,n=100,5 8 22 27 17 9 5 7,(,99.5) 99.5,109.5) 109.5,119.5) 119.5,
11、129.5) 129.5,139.5) 139.5,149.5) 149.5,159.5) 159.5, ),0.0655 0.1056 0.1772 0.2231 0.1989 0.1329 0.0661 0.0307,6.55 10.56 17.72 22.31 19.89 13.29 6.61 3.07,-1.55 -2.56 4.28 4.69 -2.89 -4.29 2.32,0.3668 0.6206 1.0338 0.9859 0.4199 1.3848 0.5560,5.3678,因为,所以接受H0,,即2159岁男子的血压(收缩压)总体X服从正态分布。,第三章,第二节,机动
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 定性 数据 检验
链接地址:https://www.31doc.com/p-3502467.html