概率论与数理统计第八章.ppt
《概率论与数理统计第八章.ppt》由会员分享,可在线阅读,更多相关《概率论与数理统计第八章.ppt(94页珍藏版)》请在三一文库上搜索。
1、第八章 假设检验,假设检验,参数假设检验,非参数假设检验,这类问题称作假设检验问题 .,总体分布已知, 检验关于未知参数 的某个假设,总体分布未知时的 假设检验问题,在本讲中,我们将讨论不同于参数估计的另一类重要的统计推断问题. 这就是根据样本的信息检验关于总体的某个假设是否正确.,第一节 基本概念,让我们先看一个例子.,这一讲我们讨论对参数的假设检验 .,某工厂生产10欧姆的电阻.根据以往生产的电阻实际情况,可以认为其电阻值 XN( , 2),标准差=0.1.现在随机抽取10个电阻,测得它们的电阻值为: 9.9, 10.1, 10.2, 9.7, 9.9, 9.9, 10, 10.5, 10
2、.1, 10.2. 试问:从这些样本,我们能否认为该厂生产的电阻的平均值为10欧姆?,例1,(一) 一个例子,确定总体:记X为该厂生产的电阻的测量值.根据假设,X N( , 2),这里 =0.1. 明确任务: 通过样本推断X的均值是否等于10欧姆. Hypothesis:上面的任务就是要通过样本去检验“X的均值=10”这样一个假设是否成立.(在数理统计中把“X的均值=10”这样一个待检验的假设记作“H0:=10”称为 “原假设”或 “零假设”,问题怎么建立:,原假设的对立面是“X的均值10” 记作“H1:10”称为“对立假设”或“备择假设”.把它们合写在一起就是:,H0:=10 H1:10,解
3、决问题的思路分析:,样本均值是的一个良好估计.如果=10,即原假设成立时,那么:,应该比较小.反之,如果它过于大, 那么想必是原假设不成立.,的大小可以用来检验原假设是 否成立.,这里的问题是,我们如何确定常数c呢,合理的思路是找出一个界限c,细致的分析:,根据定理6.4.1, n=10 =0.1,于是,当原假设 H0:=10 成立时,有:,为确定常数c,现在我们考虑一个相当小的正数(理由下面讲).例如 =0.05. 于是,当原假设 H0:=10 成立时,有:,我们就拒绝原假设 H0:=10.,我们就接受原假设 H0:=10.,现在我们就得到检验准则如下:,用以上检验准则处理我们的问题.,接受
4、原假设 H0:=10.,我们的原假设是 H0:=10 由上面分析,当H0成立时,有:,相当小.这就是说:如果H0这个假设是正确的话,检验统计量落入拒绝域就是一个发生的概率很小的事件. 过去我们提到过,通常认为:小概率事件在一次试验中基本上是不会发生的. (我们把它称做实际推断原理.),(II)道理,那么如果小概率事件发生了,即:,我们就拒绝,这时我们说:“H0不成立.” 下面我们指出这很符合人们的逻辑,实际上这种思维也叫: 带概率性质的反证法 通常的反证法设定一个假设以后,如果出现的事实与之矛盾,(即如果这个假设是正确的话,出现一个概率等于0的事件)则绝对地否定假设.,带概率性质的反证法的逻辑
5、是: 即如果假设H0是正确的话,出现一个概率很小的事件,则以很大的把握否定假设H0.,检验一个H0时是根据检验统计量来判决是否接受H0的,而检验统计量是随机的,这就有可能判决错误.这种错误有以下两类: H0事实上是正确的,但被我们拒绝了,称犯了“弃真”的(或称第一类)错误. H0事实上是不正确的,但被我们接受了,称犯了“采伪”的(或称第二类)错误.,(III)两类错误与显著性水平,假设检验的两类错误,P拒绝H0|H0为真= ,P接受H0|H0不真= .,犯两类错误的概率:,显著性水平 为犯第一类错误的概率.,由于检验统计量的随机性,所以无论犯以上哪类错误都是随机事件,从而都有一定的概率.当样本
6、容量n固定,犯两类错误的概率就不能同时被控制. 在统计学中,通常控制犯第一类错误的概率.一般事先选定一个数,(01),要求犯第一类错误的概率. 称为假设检验的显著性水平,简称水平.,由于犯第二类错误的概率的研究与计算超出了本书的范围,因此不作讨论.,说明,例1(续) 分析该例的显著性水平,我们就拒绝原假设 H0:=10.,现在让我们分析一下: 取上述c后,如果假设H0是正确的,却被我们拒绝了,即犯第一类错误的概率是多少.,可见此例我们用的检验方法犯第一类错误的概率等于 . 显著性水平等于 .,当原假设 H0:=10 成立时,有:,分析:,一般我们把显著性水平限定在一个比较小的值,通常=0.05
7、或0.01. 这样,如果H0是正确的,这就是说:如果H0是正确的话,检验统计 量落入拒绝域就是一个小概率事件.,说明,如果根据旧经验我们很相信H0是对的.要使人乐意放弃这个信念就要有十分过硬的依据,此时应取得很小.,注,如果根据旧经验我们很相信H0是对的.要使人乐意放弃这个信念就要有十分过硬的依据,此时应取得很小.,第八章 第二节 正态总体均值的假设检验,一、单个正态总体N(,2)均值的检验,(I) H0:= 0 H1: 0,设X1,X2, ,Xn为来自总体N(,2)的样本. 求:对以上假设的显著性水平=的假设检验.,方差2已知的情况 根据第一节例1,当原假设 H0:=0 成立时,有:,于是当
8、原假设 H0:=0 成立时,有:,方差2未知的况 根据定理6.4.1,以上检验法叫检验法.,n=10, =0.05, 0=10 t10-1(/2)=t9(0.025)=2.2622,以上检验法叫t检验法.,例 1 (用例8.1.1数据,但未知),上一段 H0:= 0 H1: 0 中 H1:0叫双边对立假设,上一段我们学习的叫双边检验.,接受原假设 H0:=10.,(II)单边检验 H0:=0 H1:0,问题的来源:,而 H0:= 0 H1:0 中 我们要处理的假设检验叫右边检验. 类似, H0:= 0 H1:0 中 我们要处理的假设检验叫左边检验. 这种形式的假设检验问题叫单边检验.它们也很有
9、实用意义. 例如:工厂生产的一种产品的某项指标平均值为0 ,采用了新技术或新配方后,被认为产品质量提高了,该指标的平均值应该随之上升. 我们想看看是否有显著上升.,于是问题就是检验: H0:=0 即新技术或新配方对于提高产品质量无效果. 还是 H1:0 即新技术或新配方确实有效,提高了产品质量.,解决问题的思路:,如果=0,即原假设成立时,那么:,就不应该太大.反之,如果它过于大,那么想必是原假设不成立.,方差2 已知的情况,求解:,根据定理6.4.1,当原假设 H0:=0 成立时,有:,于是当原假设 H0:=0 成立时,有:,方差2未知的情况 根据定理6.4.1,某厂生产一种工业用绳,其质量
10、指标是绳子所承受的最大拉力.假定该指标服从正态分布. 原来该厂生产的这种绳子平均最大拉力0 =15公斤.现在采用了一种新的原材料,厂方称这种原材料提高了绳子的质量,也就是说绳子所承受的最大拉力比15公斤大了. 为了检验该厂的结论是否真实,从其新产品中随机抽取50件,测得它们承受的最大拉力的平均值为15.8公斤,样本标准差S=0.5公斤.取显著性水平 =0.01.,例 2,问从这些样本看,我们能否接受厂方的结论,即新原材料是否确实提高了绳子的质量?,问题归结为检验如下假设 H0:=15 H1:15 (方差2未知) 此处n=50, =0.01,标准差S=0.5.,解:,我们拒绝原假设,认为新的原材
11、料确实提高了绳子所能承受的最大拉力.,查不到t49(0.01),利用性质: 给定 ,tn()关于自由度n是单调下降的. 我们查t45(0.01)=2.41, 则 t49(0.01) t45(0.01)=2.41,二、两个正态总体N(1 ,12)和 N(2 ,22)均值的比较,在应用上,我们经常会遇到两个正态总体N(1,12)和N(2,22)均值的比较问题.譬如:,欲比较甲、乙两厂生产的某种产品的质量. 我们把两厂生产的产品的质量指标分别看成两个正态总体N(1,12)和N(2,22).比较它们的产品质量指标的问题,就变为比较这两个正态总体的均值1和2的问题. 欲考察一项新技术对提高产品质量是否有
12、效. 我们把新技术实施前后生产的产品质量指标分别看成一个正态总体N(1,12)和N(2,22).这时,我们所考察的问题,就归结为检验这两个正态总体的均值1和2是否相等的问题.,设X1,X2 , ,Xm . Y1,Y2 , ,Yn分别为来自正态总体N(1,12)和N(2,22)的样本.考虑检验假设:,根据定理7.5.1,(I) H0: 1= 2 H1: 12,(1)方差12和22已知的情况,当H0:1= 2为真时,当H0:1= 2为真时,拒绝域为,(2)方差12=22 =2 但2未知的情况,根据定理5.1,当H0:1= 2 为真时,拒绝域为,其中:,上面,我们假定12=22.当然,这是个不得已加
13、上去的条件.但如果不加此条件,就无法使用简单易行的t检验了. 在实用中,只要我们有理由认为12和22相差不是太大就可以使用上面方法.通常是如果方差比检验未被拒绝(见下节),就认为12和22相差不是太大.,上面,我们假定12=22.当然,这是个不得已加上去的条件.但如果不加此条件,就无法 使用简单易行的t检验了. 在实用中,只要我们有理由认为12和22相 差不是太大就可以使用上面方法.通常是如果方差比检验未被拒绝(见下节),就认为12和22相 差不是太大.,说明,假设有A,B两种药,欲比较它们在 服用2小时后血液中的含量是否一样. 对药品A,随机抽取8个病人,他们服药2小时后,测得血液中药的浓度
14、(用适当的单位)为: 1.23,1.42,1.41,1.62,1.55,1.51, 1.60,1.76. 对药品B,随机抽取6个病人,他们服药2小时后,测得血液中药的浓度为: 1.76,1.41,1.87,1.49,1.67,1.81. 假定这两组观测值抽自于具有共同方差的两个正态总体.在显著性水=0.10下, 试检验病人血液中这两种药的浓度是否有显著不同?,例3,接受原假设.即认为病人血液中这两种药浓度无显著差异.,解:,问题就是从总体 XN(1,2)和YN(2,2).分别抽取样本X1,X2 ,X8 和 Y1,Y2 ,Y6. 其样本均值,样本方差分别算得为:,与(I)分析完全类似,得到:,(
15、II)单边检验 H0: 1= 2 H1: 12,方差12和22已知的情况,拒绝域为:,方差12=22 =2 但2未知的情况,拒绝域为:,类似(一)(II)的分析,拒绝域和 H0: 1= 2 H1: 12 是一样的.,两个正态总体与成对数据的区别 两个正态总体假定来自这两个正态总体的两组样本是相互独立的. 成对数据两组样本是来自对同一个总体上的重复测量,它们是成对出现的且是相关的.,(II)单边检验 H0: 12 H1: 12,三、成对数据的t检验,例如:为了考察一种降血压药的效果,测试了n个高血压病人服药前后的血压分别为 X1,X2 , ,Xn 和Y1,Y2 , ,Yn . 这里(Xi ,Yi
16、)是第i个病人服药前和服药后的血压.它们是有关系的,不会相互独立. 另一方面, X1,X2 , ,Xn 是n个不同病人的血压,由于各人体质诸方面的条件不同, 这n个观测值不能看成来自同一个正态总体的样本.同样,Y1,Y2 , ,Yn也不能看成来自同一个正态总体的样本. 这样的数据称为成对数据.,(Xi ,Yi)是在同一个人身上观测到的血压, Xi-Yi就消除了人的体质诸方面的条件差异,仅剩下降血压药的效果. 我们可以把di=Xi-Yi, i=1,2,n.看成来自正态总体N( , 2)的样本. 其中就是降血压药的平均效果. 一般的成对数据同样也是这样转变的.用(一)中所学,就是作检验: H0:=
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 概率论 数理统计 第八
链接地址:https://www.31doc.com/p-2553637.html