假设检验完整版课件.ppt
《假设检验完整版课件.ppt》由会员分享,可在线阅读,更多相关《假设检验完整版课件.ppt(105页珍藏版)》请在三一文库上搜索。
1、统计假设检验统计假设检验假设检验假设检验第一节、假设检验概述第一节、假设检验概述第二节、总体平均数的假设检验(第二节、总体平均数的假设检验(Z、T)第三节、总体比率的假设检验(第三节、总体比率的假设检验(P)第四节、总体方差的假设检验(卡方、第四节、总体方差的假设检验(卡方、F)第一节第一节 假设检验概述假设检验概述1、假设检验的基本思想、假设检验的基本思想2、假设检验的步骤、假设检验的步骤3、两类错误和假设检验的规则、两类错误和假设检验的规则 Ronald Ronald Aylmer Fisher,Aylmer Fisher,英国英国著名的统计学家,遗传学家,现著名的统计学家,遗传学家,现代
2、数理统计的奠基人之一。代数理统计的奠基人之一。他在抽样分布理论、相关回他在抽样分布理论、相关回归分析、多元统计分析、最大似归分析、多元统计分析、最大似然估计理论,方差分析和假设检然估计理论,方差分析和假设检验有很多的建树。验有很多的建树。女士品茶女士品茶20世纪世纪20年代后期在年代后期在英国剑桥英国剑桥一个夏日的下午,一个夏日的下午,一群大学的绅士和他们的夫人以及来访者,正围一群大学的绅士和他们的夫人以及来访者,正围坐在户外的桌旁享用下午的奶茶。坐在户外的桌旁享用下午的奶茶。奶茶奶茶一般是由牛奶和茶混合而成的,调制时候可一般是由牛奶和茶混合而成的,调制时候可以先倒茶后倒牛奶,也可以先倒牛奶后
3、倒茶。这以先倒茶后倒牛奶,也可以先倒牛奶后倒茶。这时候,一名女士说她能区分这两种不同做法的调时候,一名女士说她能区分这两种不同做法的调制出来的奶茶。制出来的奶茶。那么如何检验这位女士的说法?为此那么如何检验这位女士的说法?为此Fisher进行进行了研究,从而提出了假设检验的思想。了研究,从而提出了假设检验的思想。1、推推广广素素质质教教育育以以后后,教教学学效效果果是是不不是是有有所所提提高高?(教育统计教育统计)2、某种新胃药是否比以前更有效?(某种新胃药是否比以前更有效?(卫生统计卫生统计)3、醉醉酒酒驾驾车车认认定定为为刑刑事事犯犯罪罪后后是是否否交交通通事事故故会会减减少少?(司法统计
4、司法统计)4、如何检测某批种子的发芽率?(、如何检测某批种子的发芽率?(农业统计农业统计)5、海海关关工工作作人人员员如如何何判判定定某某批批产产品品能能够够通通关关?(海海关统计关统计)6、红楼梦红楼梦后后40回作者的鉴定(回作者的鉴定(文学统计文学统计)。)。7、民间借贷的利率为多少?(、民间借贷的利率为多少?(金融统计金融统计)8、兴奋剂检测(、兴奋剂检测(体育统计体育统计)假设检验的应用假设检验的应用 1 1、假设检验的基本思想、假设检验的基本思想 为为研研究究某某山山区区的的成成年年男男子子的的脉脉搏搏均均数数是是否否高高于于一一般般成成年年男男子子脉脉搏搏均均数数,某某医医生生在在
5、一一山山区区随随机机抽抽查查了了25名名健健康康成成年年男男子子,得得其其脉脉搏搏均均数数x为为74.2次次/分分,标标准准差差为为6.0次次/分分。根根据据大大量量调调查查已已知知一一般般健健康康成成年年男男子子脉脉搏搏均均数数为为72次次/分分,能能否否据据此此认认为为该该山山区区成成年年的的脉脉搏搏均数均数高于一般成年男子的脉搏均数高于一般成年男子的脉搏均数0?问问题题1:造造成成这这25名名男男子子脉脉搏搏均均数数高高于于一一般般男男子子的的原原因因是是什么?什么?问题问题2 2、怎样判断以上哪个原因是成立的?、怎样判断以上哪个原因是成立的?若若x x与与0 0接近,其差别可用抽样误差
6、解释,接近,其差别可用抽样误差解释,x x来自于来自于0 0;若若x x与与0 0相相差差甚甚远远,其其差差别别不不宜宜用用抽抽样样误误差差解解释释,则则怀怀疑疑x x不不属于属于0 0 。由资料已知样本均数与总体均数不等,原因有二:由资料已知样本均数与总体均数不等,原因有二:(1 1)两者非同一总体,即两者差异由地理气候等因素造成,)两者非同一总体,即两者差异由地理气候等因素造成,也就是可以说高山成年人的脉搏比一般人的要高;也就是可以说高山成年人的脉搏比一般人的要高;(2 2)两者为同一总体,即两者差异由抽样误差造成)两者为同一总体,即两者差异由抽样误差造成。检验如下假设:检验如下假设:原假
7、设原假设:高山成年人脉搏与一般人的脉搏没有差异:高山成年人脉搏与一般人的脉搏没有差异:=0 0备择假设备择假设:高山成年人脉搏与一般人的脉搏有差异:高山成年人脉搏与一般人的脉搏有差异:0 0假设检验的基本概念假设检验的基本概念1.概念概念事先对总体参数或分布形式作出某种假设事先对总体参数或分布形式作出某种假设然然后后利利用用样样本本信信息息来来以以一一定定的的概概率率判判断断原原假假设设是是否否成成立立参数检验和非参数检验(第参数检验和非参数检验(第8章的内容)章的内容)2.作用作用一一般般是是对对有有差差异异的的数数据据进进行行检检验验,判判断断差差异异是是否否显显著著(概率)(概率)如如果
8、果通通过过了了检检验验,不不能能拒拒绝绝原原假假设设,说说明明没没有有显显著著差差异异,那么这种差异是由抽样造成的那么这种差异是由抽样造成的如如果果不不能能通通过过检检验验,则则拒拒绝绝原原假假设设,说说明明有有显显著著差差异异,这种差异是由系统误差造成的这种差异是由系统误差造成的.证伪不能存真证伪不能存真.第一节第一节 假设检验概述假设检验概述1、假设检验的基本思想、假设检验的基本思想2、假设检验的步骤、假设检验的步骤3、两类错误和假设检验的规则、两类错误和假设检验的规则二、假设检验的步骤二、假设检验的步骤1、根据具体的问题,建立原假设和备择假设根据具体的问题,建立原假设和备择假设2、构造一
9、个合适的统计量,计算其抽样分布、构造一个合适的统计量,计算其抽样分布 (均值检验)(均值检验)3、给定显著水平、给定显著水平 和确定临界值和确定临界值。显著水平显著水平 通常取通常取0.1、0.05或或0.01。在确定了显著水平在确定了显著水平后,根据统计量的分布就可以确定找出接受区域和拒绝后,根据统计量的分布就可以确定找出接受区域和拒绝区域的临界值。区域的临界值。4、根据样本的值计算统计量的数值并作出决策。、根据样本的值计算统计量的数值并作出决策。如果如果统计量的值落在拒绝域中统计量的值落在拒绝域中,那么就没有通过检验,那么就没有通过检验,说明有显著差异,拒绝原假设。说明有显著差异,拒绝原假
10、设。如果如果统计量的值落在接受域中统计量的值落在接受域中,通过了假设检验,说明,通过了假设检验,说明这种差异是由于抽样造成,这个样本不能拒绝原假设。这种差异是由于抽样造成,这个样本不能拒绝原假设。1、原假设与备择假设、原假设与备择假设原假设原假设(null hypothesis):一般研究者想收集证据予以反对一般研究者想收集证据予以反对的假设。表示为的假设。表示为H H0 0备择假设备择假设(alternative hypothesis):一般研究者想收集证据一般研究者想收集证据予以支持的假设。表示为予以支持的假设。表示为H H1 1由于假设检验中只有在小概率事件发生的情况下才拒绝原由于假设检
11、验中只有在小概率事件发生的情况下才拒绝原假设,因此在假设检验过程中是保护原假设的。假设,因此在假设检验过程中是保护原假设的。有三种形式:有三种形式:(1)双侧检验双侧检验 H0:0,H1:0(不等,有差异);(不等,有差异);(2)左侧检验左侧检验 H0:0,H1:0(提高,增加)(提高,增加)采用哪种形式要根据实际问题。采用哪种形式要根据实际问题。某某种种饮饮料料的的易易拉拉罐罐瓶瓶的的标标准准容容量量为为335335毫毫升升,为为对对生生产产过过程程进进行行控控制制,质质量量监监测测人人员员定定期期对对某某个个分分厂厂进进行行检检查查,确确定定这这个个分分厂厂生生产产的的易易拉拉罐罐是是否
12、否符符合合标标准准要要求求。如如果果易易拉拉罐罐的的平平均均容容量量大大于于或或小小于于335335毫毫升升,则则表表明明生生产产过过程程不不正正常常。试试陈陈述述用用来来检检验验生生产产过过程程是否正常的原假设和备择假设是否正常的原假设和备择假设解解解解解解:研研研研究究究究者者者者想想想想收收收收集集集集证证证证据据据据予予予予以以以以证证证证明明明明的的的的假假假假设设设设应应应应该该该该是是是是“生产过程不正常生产过程不正常生产过程不正常生产过程不正常”。建立的原假设和备择假设为。建立的原假设和备择假设为。建立的原假设和备择假设为。建立的原假设和备择假设为 H H0 0:335ml 3
13、35ml H H1 1:335ml335ml 消消费费者者协协会会接接到到消消费费者者投投诉诉,指指控控品品牌牌纸纸包包装装饮饮料料存存在在容容量量不不足足,有有欺欺骗骗消消费费者者之之嫌嫌。包包装装上上标标明明的的容容量量为为250毫毫升升。消消费费者者协协会会从从市市场场上上随随机机抽抽取取50盒盒该该品品牌牌纸纸包包装装饮饮品品进进行行假假设设检检验验。试陈述此假设检验中的原假设和备择假设。试陈述此假设检验中的原假设和备择假设。解解解解:消消消消费费费费者者者者协协协协会会会会的的的的意意意意图图图图是是是是倾倾倾倾向向向向于于于于证证证证实实实实饮饮饮饮料料料料厂厂厂厂包包包包装装装装
14、饮料小于饮料小于饮料小于饮料小于250ml 250ml。建立的原假设和备择假设为。建立的原假设和备择假设为。建立的原假设和备择假设为。建立的原假设和备择假设为 H H0 0:250ml 250ml H H1 1:250ml H H1 1成立成立 小概率事件发生小概率事件发生 拒绝拒绝H H0 0成成立立没有发现矛盾没有发现矛盾 证明失败证明失败小概率事件没有发生小概率事件没有发生 不能不能拒绝拒绝H H0 0成立成立 小概率事件小概率事件在一次实验中不可能发生的事件,如果发生了,在一次实验中不可能发生的事件,如果发生了,那么就可以拒绝原来的假设。那么就可以拒绝原来的假设。泰力布:等待黑天鹅的人
15、泰力布:等待黑天鹅的人显著性水平和拒绝域显著性水平和拒绝域(单侧检验单侧检验 )0 0临界值临界值 样本统计量样本统计量拒绝拒绝拒绝拒绝H H0 0抽样分布抽样分布抽样分布抽样分布1-1-置信水平置信水平置信水平置信水平拒绝域拒绝域接受域接受域显著性水平和拒绝域显著性水平和拒绝域(左侧检验左侧检验 )0 0 0临界值临界值临界值 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本
16、统计量显著性水平和拒绝域显著性水平和拒绝域(左侧检验左侧检验)0 0 0临界值临界值临界值 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH0 00抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量【例2】一一种种罐罐装装饮饮料料采采用用自自动动生生产产线线生生产产,每每罐罐的的容容量量是是255ml,标标准准差差为为5ml,服服从从正正态态分分布布。换换了了一一批批工工人人后后,质质检检人人员员在在某某天天生生产产的的饮饮料料中中随随机机抽抽取取了了16罐罐进进行行检检验验,测测得得每每罐罐平
17、平均均容容量量为为257.2ml。取取显显著著性性水水平平=0.05,检检验验该天生产的饮料容量是否增加了?该天生产的饮料容量是否增加了?右侧检验右侧检验右侧检验右侧检验H0:255 H1:255z z0 0拒绝拒绝H H0 00.050.051.6451.645决策:拒绝决策:拒绝H0结结论论:样样本本提提供供的的证证据据表表明明:该该天天生生产产的的饮饮料料与与标标准准有有显显著著差差异异,可可以认为换工人后容量增加了。以认为换工人后容量增加了。显著性水平和拒绝域显著性水平和拒绝域(右侧检验右侧检验 )0 0 0临界值临界值临界值 样本统计量样本统计量样本统计量拒绝拒绝拒绝H HH0 00
18、抽样分布抽样分布抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平置信水平置信水平观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量观察到的样本统计量显著性水平和拒绝域显著性水平和拒绝域(右侧检验右侧检验 )0 0 0临界值临界值临界值 样本统计量样本统计量样本统计量抽样分布抽样分布抽样分布抽样分布1-1-1-置信水平置信水平置信水平置信水平拒绝拒绝拒绝H HH0 00第一节第一节 假设检验概述假设检验概述1、假设检验的基本思想、假设检验的基本思想2、假设检验的步骤、假设检验的步骤3、两类错误和假设检验的规则、两类错误和假设检验
19、的规则三、两类错误和假设检验的规则三、两类错误和假设检验的规则1.第第类错误类错误(弃真错误弃真错误)原假设为真时拒绝原假设原假设为真时拒绝原假设第第类错误的概率记为类错误的概率记为被称为显著性水平被称为显著性水平2.第第类错误类错误(取伪错误取伪错误)原假设为假时未拒绝原假设原假设为假时未拒绝原假设第第类错误的概率记为类错误的概率记为(Beta)(Beta)H H0 0:无罪无罪无罪无罪假设检验中的两类错误假设检验中的两类错误陪审团审判陪审团审判裁决裁决实际情况实际情况无罪无罪有罪有罪有罪有罪错误错误正确正确无罪无罪正确正确错误错误H0 检验检验决策决策实际情况实际情况H0为真为真H0为假为
20、假拒绝拒绝H0第第类错类错误误()正确决策正确决策(1-(1-)未拒绝未拒绝H0正确决策正确决策(1 )第第类错类错误误()假设检验就假设检验就假设检验就假设检验就好像一场审判过程好像一场审判过程好像一场审判过程好像一场审判过程统计检验统计检验统计检验统计检验统计检验统计检验过程过程过程过程过程过程H H0 0:药品为真药药品为真药药品为真药药品为真药假设检验中的两类错误之间的关系假设检验中的两类错误之间的关系真药真药假药假药拒绝拒绝拒绝域大拒绝域大 大大弃真弃真正确正确不拒绝不拒绝 正确正确接受域小接受域小 小小取伪取伪宁可错杀三千,不可放过一个。宁可错杀三千,不可放过一个。H H0 0:某
21、次面试为好机会某次面试为好机会某次面试为好机会某次面试为好机会好机会好机会不好的机不好的机会会拒绝拒绝(不去不去)拒绝域小拒绝域小 小小正确正确不拒绝不拒绝(去去)正确正确接受域大接受域大 大大 错误和错误和 错误的关系错误的关系 你不能同时减少你不能同时减少两类错误两类错误!只能只能增加样本容量。增加样本容量。和和 的关系就像的关系就像翘翘板,翘翘板,小小 就就大,大,大大 就小就小 四、置信区间与假设检验之间的关系四、置信区间与假设检验之间的关系1 1、根据置信度、根据置信度1-1-构造置信区间,如果统计量落在构造置信区间,如果统计量落在置信区间中,那么接受原假设,如果不在置信区间中,置信
22、区间中,那么接受原假设,如果不在置信区间中,那么拒绝原假设。那么拒绝原假设。2 2、根据显著水平、根据显著水平 ,可以构建置信度为,可以构建置信度为1-1-的置的置信区间。信区间。一个总体的检验一个总体的检验Z 检验检验(单侧和双侧)(单侧和双侧)t 检验检验(单侧和双侧)(单侧和双侧)Z 检验检验(单侧和双侧)(单侧和双侧)检验检验(单侧和双侧)(单侧和双侧)均值均值一个总体一个总体比例比例方差方差第二节第二节 总体均值的检验总体均值的检验一、单个总体均值的检验一、单个总体均值的检验(Z TZ T)二、二、两个总体均值检验(等方差、异方差)(等方差、异方差)三、两个非正态总体均值之差的检验(
23、成对检验)一、单个正态总体均值的检验一、单个正态总体均值的检验确定检验统计量的因素:确定检验统计量的因素:1 1、样本容量的大小、样本容量的大小 2 2、总体分布形状、总体分布形状 3 3、总体方差是否已知、总体方差是否已知主要情形(主要情形(6 6种)种)1.1.正态总体(方差未知,且为小样本,正态总体(方差未知,且为小样本,1 1种种)2.2.正态总体(方差已知,小样本,正态总体(方差已知,小样本,1 1种种)3.3.大样本(不论总体是否正态,不论方差是否已大样本(不论总体是否正态,不论方差是否已知,知,4 4种种)三种假设检验的形式三种假设检验的形式(双侧,左侧和右侧)(双侧,左侧和右侧
24、一)总体平均数的检验(小样本,正态,方差已(一)总体平均数的检验(小样本,正态,方差已知知)1.假定条件假定条件总体服从正态分布总体服从正态分布小样本小样本(n n 30)30),但是总体方差已知,但是总体方差已知2.检验统计量检验统计量某某机机床床厂厂加加工工一一种种零零件件,根根据据经经验验知知道道,该该厂厂加加工工零零件件的的椭椭圆圆度度近近似似服服从从正正态态分分布布,其其总总体体均均值值为为 0 0=0.081=0.081mmmm,总总体体标标准准差差为为=0.025 0.025。今今换换一一种种新新机机床床进进行行加加工工,抽抽取取n n=200=200个个零零件件进进行行检检
25、验验,得得到到的的椭椭圆圆度度为为0.0760.076mmmm。试试问问新新机机床床加加工工零零件件的的椭椭圆圆度度的的均均值值与与以以前前有有无无显显著著差差异异?(0.050.05)H0:=0.081,H1:0.081,=0.05,n=200临界值临界值(s)(双侧检验双侧检验)Z Z0 01.961.96-1.96-1.96.025.025拒绝拒绝拒绝拒绝 H H0 0拒绝拒绝拒绝拒绝 H H0 0.025.025检验统计量检验统计量检验统计量检验统计量:决策决策决策决策:拒绝拒绝拒绝拒绝H H0 0结论结论结论结论:有证据表明新机床加工的零有证据表明新机床加工的零有证据表明新机床加工的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 假设检验 完整版 课件
