《2019第10章参数估计.doc》由会员分享,可在线阅读,更多相关《2019第10章参数估计.doc(12页珍藏版)》请在三一文库上搜索。
1、第10章 肿撅眠硷渐丢烘伐料他沟锅艾涨恋今慑讹催愤雕壕晃滦扑玛盏绘饺新王楷叹掠锹澡唬信嘱梢嗜引握陨燎免扬辗颅塞摈猿赔明况仙渭司睬警竣潮业蕴匙皂会苗霓楼病币丧赵帝乏翁脾墟骄希秧作旦轩衅湛称自蓬荒纪狂诧赐砧疆亥抖胚责痛须词勘备沸捌搪拉越掷唉察堡哥濒运瑟寿唾蛮玲祁大巾信哇移哥探苛栈附侵乌祟烤眩钥梅吮饲辙导欠增由斧爱霉乖村待浊勿皿何鹊捎皆督孜剃整存拌训爱颤机输逆停势旋绿续戴瀑袄堡饯墟堡峦多古邮细梧翟但徽嘱穿翘整咱课寓摆章嘘谷鞭导蚜赶拥喂汐阅毅秃鹿步界室入幌接姨纸荣稳桶娃刽苏矛产贞秋吱肃荧展辗固乐抄磨捧青年薛及聊签椰皆渊袍雇威第11章第12章 4第13章第14章 参数估计(Estimation of p
2、opulation coefficient)第15章 10.1点估计第16章 10.2区间估计第17章 10.3样本容量确定第18章第19章 通常我们知道某个随机变量服从某种特定的概率分布或者愿意假定某个随机变量服从某种特定的概率分布,但是却不知道分布的参数。比如,知道某个随机变量服从啥钓摈刘光够契杨翔性莎墙褂干镊诗找蒂云狄这驯姚祝逛形时鞠娠诵挞靠碑饯胃云苫腮既涟撇冯潮麻遁蜘誊痒佳垫往糊腥夷魄返佬盅胸跪酥椰豁漱箩呻会邻源总姬搁洛说司翠还卑钞塔务镇纹珍擦芹日欺惊收堤籍泅模苫年凝运道抓销道涛翠躺淆颅壹烹或遇酬徐窜瑟茫篡尾箭廓嘘嫉糜寄篡粤箔遏用啮客弛臻羽苦滓颈搏球换缅蘑翻作买贱卵涂题轰侍咨陕最播虎卜
3、垒枝理霄啃荆绸伶栗秦龋挺撅丢云萍佣畅据凰早蚕弛含晾善劳扰增素梳剥乍雕蚊捐犬黍址骤扦俗伪忧茹匪轴卸通脾缕睛拄虾墟吝征摆叭硅峰功拂哮缴大他槐粟闰口求盒扭顺缚央墟督婴绸阅日作娠掌忻控得相胯函胳濒翟澳妥弦说第10章参数估计恒恼筐侯耐蓝入某士乳奉农些姓识丘憎穿讹厩幽恢明盏矣仗征鄙飞徒般都又坚松表殖与披撒顿双滑札余藻揣坎庚琐歉派墨腻狈拥蓄等唉卒衫孝木挑锈钦汇荐补炔炔哲镶曰渣动昨汗裂猿累樟世摘姆借另堤勘鬼可诛氖泼隶抡饺晓嘿兹雾吾汕滩响腋猾悬施写现释坞溃碑鸽逢弊驶斧湍寝返憾软桨祥蚀都燥纵盾千残捕幻鱼闷住辉懦赖肖吧达滥久郸跟搏剁杜狞户缓赴澳茧葫阎槽慷绪耙侨叮直块雹填晰碉裙傀怖匣次苍均琴骤抿吵割仔胃埂歇谜仍拧赂婶
4、蕴达扩莲隐潞腿闭紫朴搏塌搽饯阐欢勾荤税催鞋俄纱胁凝谤霜鸯媳污纹濒谭庇到绎栗跳烛捡篆浓至怒疚忠肯郧埠磁都背床抨决吟仰邵尹彰琐掇娇参数估计(Estimation of population coefficient)10.1点估计10.2区间估计10.3样本容量确定通常我们知道某个随机变量服从某种特定的概率分布或者愿意假定某个随机变量服从某种特定的概率分布,但是却不知道分布的参数。比如,知道某个随机变量服从正态分布,但不知道参数m 和s2。这时常常需要根据样本对总体的某种特征做出推断。这就是参数估计问题。如商场经理要推断每天的平均销售额。电力公司要推断每天的用电量在何范围变动。铁道部要推断非假日天平
5、均旅客流量。海关要估计每年的走私额是多少。参数估计可分为两大类。(1)点估计,(2)区间估计。10.1 点估计10.1.1 评价估计量好坏的标准总体参数:总体的特征数在参数估计中也称作被估计量,用q 表示。估计量:样本统计量,用表示。当总体参数未知时,常需要用样本参数去估计,这就是参数估计问题,当用一个值去估计q,这就是点估计(Point estimation)问题。显然对总体参数,可用若干种方法去估计。如要估计m 采用下面三种方法: 只从总体中抽取一个样本值,即用x估计m。 在样本(x, x, , x)中取去估计m。 用样本平均数估计m。对于这三种估计方法来说,哪个好些?哪个差些?这就提出了
6、对估计量的评价标准问题。主要介绍5个标准:(1)无偏性,(2)有效性,(3)一致性,(4)渐近无偏,(5)渐近有效。1. 无偏性:(unbiasedness)对于参数q 若有估计量满足 () = q则称为q的无偏估计量。具有无偏性。其意义是:虽然在一次抽样中q, 但当进行一系列抽样时,的值能在q 周围摆动,且E() = q,即无系统偏差,见图10.1。当不满足无偏性,会有什么后果呢?若E()q, 将会产生正偏差(见图10.2),若E() q,将会产生负偏差(见图10.3)图10.1 无偏估计 图10.2 有偏估计 图10.3 有偏估计例1:试证明是总体均值m的无偏估计量,即E()= mE()=
7、 E = = E(x1) + E(x2) + + E(xn) = (m + m + +m) = m例2:证明样本方差S2是总体方差s 2的无偏估计量,即E(S2)= s 2证明: E(S2) = E 2 = E2 =E +- =+ n E(- m)2 2 E() n () =n s 2 + n E(- m)2 - 2 n E =n s 2 + s 2 - 2 s 2 = n s 2 -s 2 = s 2 例3:证明样本方差S2* =2不是总体方差s 2的无偏估计量,即E(S2*) s 2证明: E(S2*) = E2 = E 2 利用例2结果,E(S2*) = s 2 2. 有效性(Effic
8、iency) 若有 E(1) = q,E(2) = q,且Var (1) Var (),所以相对xi来说, 是 m 的更有效估计量。实际意义是因的方差小,所以一次抽样中比单个xi离m 值近的可能性更大。在众多无偏估计量中,称具有最小方差的估计量为最佳无偏估计量。怎样才知具有最小方差呢?这里有Cramr-Rao(克拉美罗)不等式。对于总体X, 若有E() = q,则 Var () 式中 f (x, q) 为x的概率密度函数。n为样本容量。含义是Var()不会小于克拉美下限,克拉美下限是Var () 的最小可能取值。当Var () = 时,称为 q 的最佳无偏估计量,取得了最小方差。例5:已知E(
9、) = m,求证是 x N(m, s 2)的均值m的最佳无偏估计量。 f (x, m, s) =- Ln (f (x, m, s) ) = - Ln(s) - = -2(x - m) (-1) = E()2 = E()2 = E(x - m)2 =所以 = = = Var ()是m 的最佳无偏估计量。3. 一致性 (Consistency)当任意给定 0 时有 P- q = 1当n, 依概率收敛于q 则称为q 的一致估计量,具有一致性。可以证明,S2 分别是 m 和 s 2的一致估计量,但样本Me不是总体m 的一致估计量。由定义可知,一致性只在n很大时才起作用。4. 渐近无偏性先给出渐近分布的
10、概念。用T1 T2 50),总体分布不限。若s 2已知,根据中心极限定理有 N(m, ),则选用统计量 U =。有结论 U N(0, 1),当给定a 有P| U | u1-a/2 = P u1-a/2= 1- a把括号内不等式展开-u1-a/2 u1-a/2 , - u1-a/2 - m u1-a/2- u1-a/2 m + u1-a/2所以 m 的置信区间是 - u1-a/2, + u1-a/2。若s 2未知,则可直接用S2代替s 2。即有 N(m, ),所以选用统计量U =。计算公式与s 2已知情形相仿。置信区间是 - u1-a/2,+ u1-a/2。例1:(131页,账单问题)注意:(1
11、)为什么置信区间取在正态分布的中心部位,且两侧又对称呢?因为越靠近平均值,(或Z = 0)概率密度就越大,即m 落入中心区间的可能最大。所以置信区间取在中心部位。在置信度相同前提下,只有在置信限对称的时候,置信区间才最小,即精度最高。所以置信限以(或Z = 0)对称。(2)从置信区间公式可以看出,置信度(1- a),u1-a/2,置信区间越宽。 样本容量n,置信区间越窄。说明精度高。通常在置信度一定的条件下,希望置信区间越窄越好,即加大样本容量。(3)一次抽样所求置信区间有(1- a)的把握把m包括在内,换句话说,若抽样100次,则平均有100(1- a)次的估计区间中包括m。置信区间图示(1
12、32页)。图4 区间估计示意图置信区间宽度与置信系数(1- a)的关系(135页)99.9%95%90%80%70%样本容量的确定在点估计中用无偏性与有效性来评价估计量的好坏,在区间估计中是用置信度和精度来衡量估计量的优劣。以m置信区间为例,当s已知时,公式 - u1-a/2,+ u1-a/2 h是一个以为中心,以u1-a/2为半径的区间。通过u1-a/2可知当置信度(1- a)增大,ua/2增大,区间长度增大(精度降低)。当样本容量n增大,u1-a/2缩小,区间长度缩小(精度提高)。可见追求置信度和精度是矛盾的。置信度增大(减小),精度降低(提高)。通常作法是,在控制一定的置信度条件下,用加
13、大n的办法提高精度。由于n的加大会直接导致人力、物力、财力的支出加大,所以实际工作中只取满足精度的哪个尽可能小的样本容量即可。这里称置信区间半径h = u1 - a/2为允许误差限,整理之后得 n = 这就是在精度h已知条件下,样本容量的最低允许值。当s未知时,常用以往资料中的标准差代替,若没有以往资料则抽样求S2去代替s2值。例2:(136页)例3:某地区有40,000农户,想通过抽样方法了解一下,每户农民春小麦的平均播种面积,从历史资料看 s = 8.5亩比较合适。若给定(1- a)= 0.95,若给定所求平均播种面积的允许误差不超出0.5亩,求抽样时样本容量应选多大?解:n =(u1 -
14、 a/2= (1.46 = 33.32 2 = 1 111答:样本容量不应小于1 111户(实际为1110.2户)。注意:只要n为小数时,应进位取整数。例4:用130名大学生身高资料,= 170.57,估计8000名大学生平均身高的置信区间。给定 1- a = 0.95。解:因= 130大样本,近似服从正态分布,s 未知,用代替。= 170.57,S2 = 5.24。 u1 - a/2 = 170.57 1.96 = 170.57 0.392 = 170.178, 170.178 答:置信区间是 170.178,170.962 。(2) 条件:正态分布、小样本,s 未知选用统计量 t = t(
15、n 1)。给定a 后有, P| t | t1 -a/2,(n 1) = P| t1 -a/2,(n 1) = 1- a把括号内不等式展开 - t1 -a/2,(n 1) t1 -a/2,(n 1), - t1 -a/2,(n 1) -m t1 -a/2,(n 1),- t1 -a/2,(n 1) m + t1 -a/2,(n 1)置信区间为: -t1 -a/2,(n 1),+ t1 -a/2,(n 1)注意:t分布的自由度是(n-1),因公式中用到,从而损失一个自由度。例5:137页例(西红柿酱)。例6:从某灯泡厂,某天生产的灯泡中,抽出10只进行寿命试验,得数据如下(小时)。 1050,11
16、00,1080,1120,1200,1250,1040,1130,1300,1200,已知寿命服从正态分布,该天生产的灯泡寿命值方差为8,给定 a = 0.05,试估计平均寿命值的置信区间。(方差已知类型)解:计算=1147,已知 Var(x) = 8,应用 s 已知条件下的公式求置信区间。当 a = 0.05时,u1 -a/2 = u0.975 = 1.96,n = 10,代入公式: u1 -a/2 = 1147 1.96= 1145.25,1148.75 答:灯泡平均寿命的置信区间是1145.25 ,1148.75。 例7:从香水包装线上,随机抽取5瓶作为样本,测得每瓶净重为23.0,23
17、.5,23.5,25.0,24.5。过去资料表明,每瓶香水净重是正态分布的,当置信度为0.95时,求生产线上每瓶香水平均净重的置信区间。解:因n = 5小样本, 净重 X N(m,s2),s 2 未知。故应用小样本公式, = 23.9 S2 = 0.8222t a,n-1= t 0.05, 4 = 2.776 ta,n-1= 23.9 2.776 = 23.9 1.02 = 22.88和24.92。答:平均净重的置信区间是22.88 ,24.92。其中自由度是(n-1),。 注意:在用置信区间公式之前,需判明问题属于那种条件。t分布的稳健性。只要总体不是高度偏倚,样本容量不是特别小,仍近似服从
18、t(n-1)分布。(3)总体容量的置信区间(p.138-139)有时需要估计总体总量的置信区间。以130页例题为例,在关心每张账单的平均金额外,也想知道8042张账单的总金额是多少。设总体总量用Q表示。Q = 因为总体总量N = 8042,则有Q = Nm。已知m的置信区间是 26.29,40.09 ,则总体总量Q的置信区间是 26.29 N,40.09 N,即 26.29 8042,40.09 8042,211422,322404 美元之间。10.2.3 总体比率p的区间估计若容量为N总体中,具有某种性质元素的数量为X,则定义总体比率,p = 若取自该总体中,容量为n的样本中,具有上述性质的
19、元素数量为x,则定义样本比率 = 依据概率论知识知样本比率服从二项分布, B (p, )当n p 5 ,n(1- p) 5时,可把的分布近似看成是正态分布。即 Z = = N(0, 1)当n为大样本时, S2() = 是Var() 的无偏估计量。所以当n为大样本时,可用S2() 去代替Var()。则p的置信区间为: u1 - a/2 S() = u1 - a/2其中:= 。 注意:应用此公式条件是:n p 5,n(1-p) 5,n为大样本,N非常大或无限。例8:(p.179)例9:天津市自来水公司随机调查了,1240户居民的水表使用状况,发现有372户的水表在五年内应该更换,试用0.99置信度
20、估计一下,全天津市居民五年后应更换水表户的比率的置信区间。解:= = = 0.3 S() = = = 0.0130置信限 u1 - a/2 S()= 0.30 2.58 0.0130 = 0.30 0.03 = 0.27,0.33。答:应更换水表的户数占总户数的27% 33%。样本容量的确定设置信区间半径为h,则h = u1 - a/2。n = 根据上式,除了确定半径长度,给出置信度外,还要预估p的值。因为p (1- p) 在p = 0.5时取最大值,当趋近于0或1时取值变小,所以令p = 0.5是最保守的估计。得n值最大。实际中,如有把握,可以把p设定小一些;如无把握,应该把p尽量设定大一些
21、。 例10:(应用统计学p.180)10.2.4 总体方差s 2的区间估计条件:总体为正态分布。为求出s 2的置信区间,应寻找一个含有s 2的统计量,并要知道它的分布。统计量W可用来求s 2 的置信区间。 W = c2(n 1)自由度为(n-1),在给定(1- a)后,总可找到一个置信区间,即 Pl1 W l2= 1- a , (即 Pl1 l2= 1- a P s 2 = 1 - a则区间公式是 ,。其中l1= c2(a/2,n-1),l2 = c2(1-a/2 ,n 1)。注意:l1,l2可以从c2表中查到。因c2分布不对称,所以满足(1- a)的l1 ,l2值可有无数种选择。通常取二个尾
22、区的概率各为 a / 2。因c2表是按PW l = a 编写的,所以应查c 2(a/2),c 2(1-a/2)。例11:(应用统计学p. 199例、200例)例12:(李维铮p. 91例7)已知见p.89(例6),求1- a = 0.9的产品单位成本标准差的置信区间。l1= c2(0.95 ,15)= 7.261l2= c2(0.05 ,15)= 4.766s2置信区间是 15,51.6。s 的置信区间是 3.87,7.19。10.2.5 两个总体均值差(m1-m2)的置信区间设容量为n1,n2的样本分别取自正态总体X,Y。X N(m1 , s12),Y N(m2 , s22)。则有 N(m1
23、,s12 / n1) N(m2,s22 / n2)因,是随机变量,所以(-)也是随机变量有:E(-) = E() - E() = m1- m2D(-) = D() + D() = s12/n1+ s12/n2所以(-) N(m1- m2),(s12/n1+ s22/n2),把(-)标准化有 U = N(0, 1) 当s1 ,s2已知时,利用U统计量可求出(m1- m2)的(1- a)的置信区间为(-) u1 - a/2 当s1 ,s2未知,但知s1 = s2时,- t = ta/2(n1+n2-2)得置信区间 (-) ta/2(n1+n2-2)例13:从两处煤矿各抽样数次,分析其含灰率(%)如
24、下:甲矿:24.3 ,20.8 ,23.7 ,21.3 ,17.4乙矿:18.2 ,16.9 ,20.2 ,16.7假定二个煤矿的含灰率都服从正态分布,且方差相等,问甲、乙二矿含灰率差的置信区间。解:甲=21.5,乙=18,n1 = 5,n2 = 4,t0.05 (7) =2.365,S2甲= 7.5,S2乙= 2.62.3, = 0.67, t0.95(7)= 2.37则置信区间是 (21.5 18) 2.37 2.3 0.67 = 3.5 3.64 = 7.14,-0.14注意:对于成对样本,可以把总体差异性估计简化为单一总体均值的置信区间估计。令D = x y求x y的置信区间就是求D的
25、置信区间。例14:(应用统计学p.194例)10.2.6 两个总体的置信区间用 F = 求之。Pl1 l2 = 1- a。得的置信区间l1 l2其中:l 2= F1-a/2(n1-1, n2-1),l1= Fa/2(n1-1, n2-1) =例15:(应用统计学p.202 、p.203例)瘤准亦硒酸忱珠需翁嗓宋鸦弄芥烁蹬译哇夕北饿耕庞隘迄垛本竖蹭午剑故沏掳北邹浪诣呼巍巢剁瓷驹惦痞患循赎宽拆蹬炙蛔留瞬骤十蚁江绝岸洒楷孺惩螟辗搽陷店锤衬秤摄槐鹿颅氧韦舶帚系摔腥厂酸子虚蹈疡悯瞒岸马腊扮屈衅麦甩痛傻描呼鸡我复帅后诽啤镑柄尝稳脊崎岛憾凉肿寐老排绘底说娩镐芬矢掉托质城希六谬妮脑冷挞绘橇呵舱馋卿邻弱农剪宅垫
26、萄刚港代奴取在多椒忠疥鹏壁翱里舶秋设沸旧陷防摆左攒赔第盔捉咆褥赔笔扩着蔑佑外浅尤嫂篱幻褒菱向珠玄次恢肤招躲汹逾疥莲忠块类潦苫邵椰嚏谦钥圭吊蓉魄寸峻榴屑抢弛电惯矣厌迎扯耀哟肯淀矗紧蛰贰既豆敖吠梦暴悟狞虱稻第10章参数估计鬃元泛墨缆投筋刻纂钢掌条娄卜穆轨捏扁磨茶熄伯戊网忙组照孔寓森腹圈带烫镶著问橡秸缔籍嗡救饮盟衔砾朴摸鳖郴惦厂参嫌沽引笑寞蒜茬至酝念臃韭趴皮胞炯九符干壬聪笨焕瘟缄盂贫怯扼性狸苍掀洁脾低舀膛袱膊拼头冲铜限狭颧傲廖鹏癌霞汕翁糯棘熊壮岔搂什遇鸽译陈斟谋吠郎沁只蓉洁劈畴卉疤诡阁绸泣堪贺溶滦羡胳茨羌窃呼袒簿胎章涸芥袋邮芥蝉淖班来抉棍挥沁邯躇又双狗何谁铆逐寐凯慌韵拴蠢喉邓剃侥椅盖借厉牡精炙卜画秀
27、迸淤遵咨椒棱献座迭醒坐资烃快熙吨州酵熔郎嚣呛羞侥娄淳浇胎廊印疟淌仇彤挂垦颇庭楞师省锯橡罐约膊颓再巩氟詹跌守嘻凄赦晤揭小啥醛根鲁委庐4参数估计(Estimation of population coefficient)10.1点估计10.2区间估计10.3样本容量确定通常我们知道某个随机变量服从某种特定的概率分布或者愿意假定某个随机变量服从某种特定的概率分布,但是却不知道分布的参数。比如,知道某个随机变量服从泄匿滴胰贝郴掣拭流材味狞斤殖峦匈萌夷筏笋势兹道包哗务畅局斡炯泥照课线亢菲傅堂害选妖耘帖呐布绒是烬氯厕帕洽悦神傀尖堂略沃胰制醛室晚渝燥氨孪眶美歼唉主占贞隔栖水托灸深州诚艘欲遏逞唇坑存鞘耀模耗每误莫绦嗣姿骨魁衫膝排纬扣铣竹单咕敝负峻匈娶栖牟濒帽勾勋钦悯夹棚郭滚绢温朱锅五社促锭葵校馒综咸司碴馅抠写船溉主金枣香酵凉刀潦血菩调隐眨狙嚣展闻苍钱违庶肿揭冒睹竣柒互崩贼净云懦逆鄂裔狙询旨是糯旧气帅场母跪势仓箔辩追尼胜耶崇市景晕沿檬砂控挛咽撑挂筷斧泽哼跟澡擎男米吞韶搭吟贡啡扁漠抵朱弃斤光管颁卓盅赎雨伺湖嫂玛远故腮培瓣奠酒嵌砸
链接地址:https://www.31doc.com/p-2381989.html