第八章假设检验.ppt
《第八章假设检验.ppt》由会员分享,可在线阅读,更多相关《第八章假设检验.ppt(58页珍藏版)》请在三一文库上搜索。
1、第八章 假设检验,什么是假设检验,假设检验就是利用样本数据对关于总体参数的原假设和备选假设进行检验的过程。若样本数据不支持原假设,则拒绝原假设; 原假设用 标注, 为备选假设。 原假设就是,在进行检验之前,对总体参数或总体分布做的一个初步假设。 备选假设与原假设互为排斥。,假设检验的原理,在原假设为真的前提下考虑某统计量的一次实现值,若该值的出现是一个小概率事件,则表明原假设成立的前提是不正确的,从而拒绝原假设。 一般认为,小概率事件在一次试验中不可能出现,可以忽略不计。若原假设成立的情况下,由样本的统计量的出现是小概率事件,则拒绝原假设。,假定已知某总体服从正态分布,其标准差为2,但不知其均
2、值。现有人认为其均值为3,抽取一个容量为36的样本,得到样本平均值为3.9 原假设 ;备选假设: 假定H0成立,则有, 若|z|1.96,则该事件发生是小概率事件,(因为有:P(|z|1.96)=0.05)那么我们认为不会发生,因此我们拒绝原假设。接受备选假设。 计算得到z2.7,因此我们拒绝原假设。,0,1.96,1.96,拒绝域/2,拒绝域/2,注意到:假设检验涉及到小概率事件的标准,多小的概率算不可能出现? 在上例中,小概率事件的出现以0.05为 标准,这一标准我们称为显著水平,用表示。 由于确定了显著水平,我们相应的可以确定假设检验的临界值,上例中的临界值为1.96和-1.96。这里出
3、现了双侧临界值的情况。,如何建立原假设和备选假设,建立规则的三种情形: 1.检验研究中的假设:研究中的假设一般为备选假设(拒绝H0,则研究假设为真,将得出支持研究的结论并采取行动;生产线) 2.检验某项声明的有效性:在涉及对某项声明的有效性进行检验的情况下,通常将声明作为原假设(声明被质疑,拒绝H0将得出该声明不正确的结论。应考虑采取措施予以纠正;质检),3.决策中的假设检验:在上述两种情形中,如果拒绝H0则必须采取措施。然而,当面对分别与原假设和备选假设相联系的措施,决策者必须在二者间做出选择,在这种情况下,无论是否拒绝H0,都必须采取某种措施。,关于假设形式的总结 假设检验:双侧检验和单侧
4、检验 双侧检验:H0: Ha: 单侧检验:H0: 或 Ha: 或 表达式中的等号总是出现在原假设中,在选择原假设或备选假设时,应将试图建立的结果设定为备选假设。,第一类错误和第二类错误,原假设和备选假设是关于总体的两个对立的解释。二者之中有且仅有一个是正确的。 因为假设检验是建立在样本数据基础上的,因此得出来的结论不一定百分百正确,存在发生错误的可能。 存在两种错误:第一类错误和第二类错误,例如:某汽车生产研究小组设计了一种能提高汽车油料效能的新的燃料喷射器。目前旧型喷射器的效能为24公里每加仑,设定的假设检验如下: H0:u24 由Ha表明,我们将试图找出的结论放入备选假设。,在这个例子中,
5、当H0为真时而拒绝了H0,表明这种新型喷射器实际上不比目前所用的喷射器好,但却错误认为这种新型的喷射器提高了每加仑燃料的功效,那么此时发生了第一类错误。 若当H0为假时而接受了H0,表明这种新型喷射器实际上比目前所用的喷射器好,但错误认为这种喷射器没有提高每加仑燃料的功效,则此时发生了第二类错误。,第一类错误发生的概率为,即检验的显著性水平。一般设置为0.05和0.01。 在发生第一类错误概率较小时,如果拒绝原假设H0,则我们可以很大的程度相信关于拒绝原假设的结论是正确的。 在这种情况下,统计上支持我们做出H0为假,而Ha为真的结论。即拒绝原假设总有较大的把握。,第二类错误发生的概率为:它是把
6、来自=1(10)的总体的样本值代入检验统计量所得结果落入接受域的概率。 在绝大多数的假设检验运用中,一般都只对第一类错误进行控制,而通常不对第二类错误加以控制。由于第二类错误发生的不稳定性,我们一般采用“不能拒绝H0”而不采用“接受H0”的说法。采用“不能拒绝H0”的说法使我们避免了犯第二类错误的风险。因此,我们往往把要否定的陈述作为原假设,而把拟采纳的陈述本身作为备择假设。,总体均值的单侧检验:大样本,HILLTOP咖啡的标签上表明其重量至少为3磅,今抽取36听咖啡组成一样本,检测其平均质量,得到x=2.92磅。由以前的研究结果已知总体的标准差为 =0.18,选定0.01,检验标签上的重量说
7、明。,H0: u3 Ha: u3 检验统计量为: 根据显著性水平=0.01,对应的拒绝域面积为0.01,临界值为-2.33 Z-2.33,所以拒绝H0,即可认为没听咖啡的容量不足3磅。 统计证据支持对HILLTOP咖啡重量不足采取投诉措施。,0,-2.67,拒绝域=0.01,-2.33,落入小概率事件发生区域,同样咖啡检验平均重量的例子,现抽取新的样本,平均重量为2.97磅,再做检验。,H0: u3 Ha: u-2.33,所以不能拒绝H0,即不能说每听咖啡的平均重量不低于3磅的说明不真实。 统计证据不能支持对HILLTOP咖啡重量不足采取投诉措施。,0,1,拒绝域=0.01,-2.33,样本统
8、计量未落入小概率事件发生区域,小结:总体均值的单侧检验(大样本下),1.左侧检验的形式 假设:H0: uu0,Ha: uu0 检验统计量 (总体方差已知) (总体方差未知) 显著性水平为是的拒绝法则为: 若 ,则拒绝H0,2.右侧检验的形式 假设:H0: uu0,Ha: uu0 检验统计量 (总体方差已知) (总体方差未知) 显著性水平为是的拒绝法则为: 若 ,则拒绝H0,假设检验的步骤,1.确定原假设和备选假设 2.选择检验统计量 3.指定检验的显著性水平 4.建立拒绝原假设的规则 5.收集样本数据,计算检验统计量的值 6.将检验统计量的值域拒绝规则的临界值比较,以决定是否拒绝原假设。或者,
9、由检验统计量的值计算p值,利用p值确定是否拒绝原假设。,关于p值: 大多数统计软件提供有关假设检验的p值,p值是一个概率值。若我们假定原假设为真,则p值是获得一个至少与实测结果有相同不可能性的样本结果的概率。P值常被称为实测显著性水平。若p值,则拒绝H0,0,-2.67,P-Value=0.0038,-2.33,拒绝域,-1,P-Value=0.1587,总体均值的双侧检验(大样本下),1.检验的形式 假设: H0:u=u0, Ha:uu0 检验统计量: (总体方差已知) (总体方差未知) 显著性水平为的拒绝法则为:若|z| ,则拒绝H0。,0,拒绝域为/2,拒绝域,拒绝域,拒绝域为/2,某厂
10、采用自动包装机分装产品,假定每包产品的重量服从正态分布,每包标准重量为1000克,某日随机抽查40包,测得样本平均重量为986克,样本标准差是24克。试问在=0.05的显著性水平上,能否认为这天自动包装机工作正常?,由题意有:u0=1000,x=986,s=24,n=40(大样本) 原假设为 H0: u=u0 Ha: uu0 检验统计量为 有Z=-3.69-1.96,因而拒绝认为自动包装机运作正常的原假设。 因此统计上能够支持对包装机运作不正常采取的措施。,2.关于双侧检验的P值: 在双侧检验中,p值为分布一侧面积的两倍。据测我们可以将P值与直接比较。如果不是将一侧面积的两倍取为P值,那么必须
11、另行建立基于一侧面积/2的关于p值的拒绝规则。,3. 区间估计与假设检验的关系 在置信水平1-下的区间估计/显著水平为的假设检验,因为有: 所以,若x落在不拒绝区域内,则u0必被包含在置信区间内。即:检验统计量的值落在不拒绝域内,与置信区间包含总体参数是等价的。因此,我们有以下的用置信区间进行假设检验的形式。,假设H0:u=u0;Ha:uu0 我们可以通过计算置信区间来判断是否拒绝或不拒绝原假设。 计算1-置信水平下的估计区间: 或 若所得的置信区间不包含u0,则拒绝H0,否则不能拒绝。,上例,我们用求置信区间的方法,来判断原假设是否合理。 大样本下满足中心极限定理,样本均值的抽样分布服从正态
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 假设检验
链接地址:https://www.31doc.com/p-2981047.html