第5章假设检验贾俊平统计学第三版贾俊平.ppt
《第5章假设检验贾俊平统计学第三版贾俊平.ppt》由会员分享,可在线阅读,更多相关《第5章假设检验贾俊平统计学第三版贾俊平.ppt(102页珍藏版)》请在三一文库上搜索。
1、第 5 章 假设检验,5.1 假设检验的基本问题 5.2 一个总体参数的检验 5.3 两个总体参数的检验,学习目标,假设检验的基本思想和原理 假设检验的步骤 一个总体参数的检验 两个总体参数的检验 P值的计算与应用 用Excel进行检验,5.1 假设检验的基本问题,一、假设的陈述 二、两类错误与显著性水平 三、统计量与拒绝域 四、利用P值进行决策,假设的陈述,什么是假设? (hypothesis), 对总体参数的具体数值所作的陈述 总体参数包括总体均值、比率、方差等 分析之前必需陈述,什么是假设检验? (hypothesis test),先对总体的参数(或分布形式)提出某种假设,然后利用样本信
2、息判断假设是否成立的过程 有参数检验和非参数检验 逻辑上运用反证法,统计上依据小概率原理,原假设与备择假设,原假设 (null hypothesis),研究者想收集证据予以反对的假设 又称“0假设” 总是有符号 , 或 4. 表示为 H0 H0 : = 某一数值 指定为符号 =, 或 例如, H0 : 10cm,研究者想收集证据予以支持的假设 也称“研究假设” 总是有符号 , 或 表示为 H1 H1 : 某一数值,或 某一数值 例如, H1 : 10cm,或 10cm,备择假设 (alternative hypothesis),【例】一种零件的生产标准是直径应为10cm,为对生产过程进行控制,
3、质量监测人员定期对一台加工机床检查,确定这台机床生产的零件是否符合标准要求。如果零件的平均直径大于或小于10cm,则表明生产过程不正常,必须进行调整。试陈述用来检验生产过程是否正常的原假设和被择假设,提出假设 (例题分析),解:研究者想收集证据予以证明的假设应该是“生产过程不正常”。建立的原假设和备择假设为 H0 : 10cm H1 : 10cm,【例】某品牌洗涤剂在它的产品说明书中声称:平均净含量不少于500克。从消费者的利益出发,有关研究人员要通过抽检其中的一批产品来验证该产品制造商的说明是否属实。试陈述用于检验的原假设与备择假设,提出假设 (例题分析),解:研究者抽检的意图是倾向于证实这
4、种洗涤剂的平均净含量并不符合说明书中的陈述 。建立的原假设和备择假设为 H0 : 500 H1 : 500,【例】一家研究机构估计,某城市中家庭拥有汽车的比率超过30%。为验证这一估计是否正确,该研究机构随机抽取了一个样本进行检验。试陈述用于检验的原假设与备择假设,提出假设 (例题分析),解:研究者想收集证据予以支持的假设是“该城市中家庭拥有汽车的比率超过30%”。建立的原假设和备择假设为 H0 : 30% H1 : 30%,原假设和备择假设是一个完备事件组,而且相互对立 在一项假设检验中,原假设和备择假设必有一个成立,而且只有一个成立 先确定备择假设,再确定原假设 等号“=”总是放在原假设上
5、 因研究目的不同,对同一问题可能提出不同的假设(也可能得出不同的结论),提出假设 (结论与建议),双侧检验与单侧检验,备择假设没有特定的方向性,并含有符号“”的假设检验,称为双侧检验或双尾检验(two-tailed test) 备择假设具有特定的方向性,并含有符号“”或“”,称为右侧检验,双侧检验与单侧检验,双侧检验与单侧检验 (假设的形式),两类错误与显著性水平,假设检验中的两类错误,1. 第类错误(弃真错误) 原假设为真时拒绝原假设 第类错误的概率记为 被称为显著性水平 2. 第类错误(取伪错误) 原假设为假时未拒绝原假设 第类错误的概率记为(Beta),显著性水平 (significan
6、t level),1. 是一个概率值 2. 原假设为真时,拒绝原假设的概率 被称为抽样分布的拒绝域 3. 表示为 (alpha) 常用的 值有0.01, 0.05, 0.10 4. 由研究者事先确定,假设检验中的小概率原理, 什么小概率? 1. 在一次试验中,一个几乎不可能发生的事件发生的概率 2. 在一次试验中小概率事件一旦发生,我们就有理由拒绝原假设 3. 小概率由研究者事先确定,检验统计量与拒绝域,根据样本观测结果计算得到的,并据以对原假设和备择假设作出决策的某个样本统计量 对样本估计量的标准化结果 原假设H0为真 点估计量的抽样分布,检验统计量 (test statistic),标准化
7、的检验统计量,显著性水平和拒绝域 (双侧检验 ),抽样分布,显著性水平和拒绝域 (单侧检验 ),决策规则,给定显著性水平,查表得出相应的临界值z或z/2, t或t/2 将检验统计量的值与 水平的临界值进行比较 作出决策 双侧检验:I统计量I 临界值,拒绝H0 左侧检验:统计量 临界值,拒绝H0,利用 P 值 进行决策,什么是P 值? (P-value),在原假设为真的条件下,检验统计量的观察值大于或等于其计算值的概率 双侧检验为分布中两侧面积的总和 反映实际观测到的数据与原假设H0之间不一致的程度 被称为观察到的(或实测的)显著性水平 决策规则:若p值, 拒绝 H0,双侧检验的P 值,左侧检验
8、的P 值,右侧检验的P 值,假设检验步骤的总结,陈述原假设和备择假设 从所研究的总体中抽出一个随机样本 确定一个适当的检验统计量,并利用样本数据算出其具体数值 确定一个适当的显著性水平,并计算出其临界值,指定拒绝域 将统计量的值与临界值进行比较,作出决策 统计量的值落在拒绝域,拒绝H0,否则不拒绝H0 也可以直接利用P值作出决策,5.2 一个总体参数的检验,一、总体均值的检验 二、总体比率的检验 三、总体方差的检验,一个总体参数的检验,总体均值的检验,总体均值的检验 (作出判断),样本容量n,总体均值的检验 (大样本),总体均值的检验 (大样本),1. 假定条件 正态总体或非正态总体大样本(n
9、30) 使用z检验统计量 2 已知: 2 未知:,总体均值的检验( 2 已知) (例题分析),【例】一种罐装饮料采用自动生产线生产,每罐的容量是255ml,标准差为5ml。为检验每罐容量是否符合要求,质检人员在某天生产的饮料中随机抽取了40罐进行检验,测得每罐平均容量为255.8ml。取显著性水平=0.05 ,检验该天生产的饮料容量是否符合标准要求?,双侧检验,总体均值的检验( 2 已知) (例题分析),H0 : = 255 H1 : 255 = 0.05 n = 40 临界值(c):,检验统计量:,决策:,结论:,不拒绝H0,样本提供的证据表明:该天生产的饮料符合标准要求,总体均值的检验(z
10、检验) (P 值的计算与应用),第1步:进入Excel表格界面,直接点击“f(x)”(粘贴 函数) 第2步:在函数分类中点击“统计”,并在函数名的 菜单下选择“NORMSDIST”,然后确定 第3步:将 z 的绝对值1.01录入,得到的函数值为 0.843752345 P值=2(1-0.843752345)=0.312495 P值远远大于,故不拒绝H0,总体均值的检验( 2 未知) (例题分析),【例】一种机床加工的零件尺寸绝对平均误差为1.35mm。生产厂家现采用一种新的机床进行加工以期进一步降低误差。为检验新机床加工的零件平均误差与旧机床相比是否有显著降低,从某天生产的零件中随机抽取50个
11、进行检验。利用这些样本数据,检验新机床加工的零件尺寸的平均误差与旧机床相比是否有显著降低? (=0.01),左侧检验,总体均值的检验( 2 未知) (例题分析),H0 : 1.35 H1 : 1.35 = 0.01 n = 50 临界值(c):,检验统计量:,拒绝H0,新机床加工的零件尺寸的平均误差与旧机床相比有显著降低,决策:,结论:,总体均值的检验(z检验) (P 值的计算与应用),第1步:进入Excel表格界面,直接点击“f(x)”(粘贴 函数) 第2步:在函数分类中点击“统计”,并在函数名的 菜单下选择“ZTEST”,然后确定 第3步:在所出现的对话框Array框中,输入原始数据所在区
12、 域 ;在X后输入参数的某一假定值(这里为1.35);在 Sigma后输入已知的总体标准差(若未总体标准差未 知则可忽略不填,系统将自动使用样本标准差代替) 第4步:用1减去得到的函数值0.995421023 即为P值 P值=1-0.995421023=0.004579 P值=0.01,拒绝H0,总体均值的检验(z检验) (P 值的图示),总体均值的检验( 2 未知) (例题分析),【例】某一小麦品种的平均产量为5200kg/hm2 。一家研究机构对小麦品种进行了改良以期提高产量。为检验改良后的新品种产量是否有显著提高,随机抽取了36个地块进行试种,得到的样本平均产量为5275kg/hm2,标
13、准差为120/hm2 。试检验改良后的新品种产量是否有显著提高? (=0.05),右侧检验,总体均值的检验( 2 未知) (例题分析),H0 : 5200 H1 : 5200 = 0.05 n = 36 临界值(c):,检验统计量:,拒绝H0 (P = 0.000088 = 0.05),改良后的新品种产量有显著提高,决策:,结论:,总体均值的检验(z检验) (P 值的图示),总体均值的检验 (大样本检验方法的总结),总体均值的检验 (小样本),总体均值的检验 (小样本),1. 假定条件 总体服从正态分布 小样本(n 30) 检验统计量 2 已知: 2 未知:,总体均值的检验 (小样本检验方法的
14、总结),注: 已知的拒绝域同大样本,总体均值的检验 (例题分析),【例】一种汽车配件的平均长度要求为12cm,高于或低于该标准均被认为是不合格的。汽车生产企业在购进配件时,通常是经过招标,然后对中标的配件提供商提供的样品进行检验,以决定是否购进。现对一个配件提供商提供的10个样本进行了检验。假定该供货商生产的配件长度服从正态分布,在0.05的显著性水平下,检验该供货商提供的配件是否符合要求?,总体均值的检验 (例题分析),H0 : = 12 H1 : 12 = 0.05 df = 10 - 1 = 9 临界值(c):,检验统计量:,不拒绝H0,该供货商提供的零件符合要求,决策:,结论:,总体均
15、值的检验( t 检验) (P 值的计算与应用),第1步:进入Excel表格界面,直接点击“f(x)”(粘贴 函数) 第2步:在函数分类中点击“统计”,并在函数名的 菜单下选择“TDIST”,然后确定 第3步:在出现对话框的X栏中输入计算出的t的绝对值 0.7035,在Deg-freedom(自由度)栏中输入 本例的自由度9,在Tails栏中输入2(表明是双 侧检验,如果是单测检验则在该栏输入1) 第4步:P值= 0.499537958 P值=0.05,故不拒绝H0,总体比率的检验,总体比率检验,假定条件 总体服从二项分布 可用正态分布来近似(大样本) 检验的 z 统计量, 0为假设的总体比率,
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 假设检验 贾俊平 统计学 第三 版贾俊平
链接地址:https://www.31doc.com/p-3371421.html