六章随机样本与抽样分布.ppt
,第六章、随机样本与抽样分布,数理统计的任务: 观察现象,收集资料,创建方法,分析推断。,统计推断: 研究如何利用一定的数据资料对所关心的问题作出尽 可能精确、可靠的结论。 特点是:由“部分”推断“整体”。,引言,试验的设计与分析,统计推断,总体:研究对象的全体(整体)。,个体:每一个研究对象。,6.1.1 总体,第6.1节 简单随机样本,样本: 由部分个体构成的集合。经常说,来自(或取自 )某总体的样本。,样本具有二重性: 在抽样前,它是随机向量,在抽样后,它是数值向量(随机向量的取值)。,样本容量: 样本中所含个体的个数。,6.1.2简单随机样本样本,简单随机样本(s.r.s): 具有两个特点的样本: 代表性(组成样本的每个个体与总体同分布), 独立性 (组成样本的个体间相互独立)。,如,检验一批灯泡的质量,从中选择100只,则,总体:这批灯泡的质量 个体:这批灯泡中的每一只的质量 样本:抽取的100只灯泡(简单随机样本)的质量 样本容量:100 样本检验值: x1,x2,x100,X X1,X2,X100 100 样本值,定义: 设X为一随机变量,X1,X2,Xn是一组独立且与X同分布的 随机变量,称X为总体; (X1,X2,Xn)为来自总体X的简单随机样本; n为样本容量; 每一个xi(i=1,2,n)称为样本的一个观测值; 在依次观测中,样本的具体观测值x1,x2,xn称为样本值.,注意:样本是一组独立同总体分布的随机变量.,样本的分布,统计的一般步骤:,6.2 统计量,1、定义:设X1,X2,Xn是来自总体X的一个样本, 是 样本的函数,若 中不含任何未知参数,则称 为统计量., 样本均值,2、常用统计量:, 样本方差(修正), 样本标准差, 样本k阶原点矩, 样本k阶中心矩,顺序统计量,设X1,X2,Xn的观察值为x1,x2,xn,从小到大排序得 到: x(1),x(2),x(n), 定义 X(k)=x(k), 由此得到的 (X(1),X(2),X(n)或它们的函数都称为顺序统计量. 显然X(1) X(2) X(n),1) 样本中位数,2) 样本极差,R= X(n)- X(1),3、较常用的顺序统计量,3)样本分布函数(经验分布函数),格里汶科定理:,设总体X的分布是F(x),则下式成立,第6.3节 抽样分布,统计量的分布称为抽样分布.,6.3.1 样本均值的分布,定理1.设X1,X2,Xn是来自总体 的样本, 是样本均 值,则有,注:在大样本问题时,由中心极限定理知,注意: 1、两个独立的正态分布的随机变量的和仍服从正态分布.,即:若X1N(1,12), X2N(2,22), X1,X2独立,则,X1+X2N(1+ 2,12+ 22),正态分布的可加性,2、有限个独立的正态分布的线性函数仍服从正态分布.,即:若XiN(i,i2), (i=1,2,.n), X1,X2, .Xn相互独立,实数a1,a2,.,an 不全为零,则,z,1-,标准正态分布及其100 %分位数,定义:设XN(0,1),对任意01,若PX=,则称为标准正态分布的100 % 分位数, 记为,z,例6.3.1 设XN(0,1), 分别为0.95,0.975,0.75,求X关 于的100 %分位数.,解: =0.95 时,反查表得:,z0.95=1.645,类似可得:,z0.975=1.96, z0.75=0.67,分布及其性质,1.定义:,6.3.2,2.性质:,例6.3.1 设 是来自总体 的s.r.s, 则 服从( )分布。,例 6.3.2 设 是取自总体N (0,4) 的s.r.s, 当a= , b= 时,解:,由题意得,a =1/20 b=1/100,3、设 是来自正态总体 X 的s.r.s求系数a,b,c,使得 服从 分布,并求其自由度。,3. 的密度曲线,n=1,n=4,n=10,随着n的增大,密度曲线逐渐趋于平缓,对称.,定义:,查表求分位数:,(1)若P(X)=,则,(2)若P(X)=,则,4. 分布的100 % 分位数,解:,查表得:,查表得:,例6.3.2. 设 X (10), P(X2)=0.95, 求1,2.,6.3.3 t 分布及其性质,1.定义:,特点: 关于y轴对称;随着自由度的逐渐增大,密度曲线逐渐接近于标准正态密度曲线.,2.t分布的密度曲线:,3. t分布的100%分位数:,例6.3.3 设Xt(15),求 =0.975 =0.005的分位数;,解: =t0.975(15),查表得,=2.1315,=t0.005(15),查表得,=-2.9467,例4.1.7(974) 设随机变量 X 和 Y 相互独立且都服从正态分 布 ,而 和 分别是来自总体 X 和 Y 的 s.r.s,则统计量 服从( )分布, 参数为( ).,t,9,解:,故,与 独立,所以,6.3.4 F 分布及其性质,1.定义,2.性质:,3.F分布的密度曲线,4.F分布的100%分位数,5. 分位数的计算,(1)若P(F)=,当 较大则,(2)若P(F)=(比较小),则,P(1/F1/)=1-,故,例6.3.4 设F (24,15),分别求满足,(2)=F0.975(24,15),=2.70,(3)P(X)=0.025,比较小,P(1/X1/)=0.025,所以,=0.41,=2.29,解(1) =F0.95(24,15),思考题:,6.3.5 正态总体中其它几个常用的分布,定理6.3.3 设 是来自总体 的 s.r.s, 分别是样本均值和样本方差,则,定理6.3.4 设 是来自总体 的 s.r.s, 分别是样本均值和样本方差,则,其中:,则有,引理:设XN(1,12),Y N(2,22),X,Y相互独立,从中分别抽 取容量为n1,n2的样本,样本均值分别记为,求:,例6.3.5 (993) 设 是来自正态总体 X 的s.r.s,证明统计量 Zt (2),例6.3.6(994) 设 是来自总体,的s.r.s, 是样本均值,记,则服从自由度为 n-1 的 t 分布的随机变量是( ),6.1),6.2),1一枚均匀铜币,最少需抛掷多少次才能保证其正面出现 的频率介于0.4和0.6之间的概率不小于90%。试用Chebyshev不等式以及De Moivre-Laplace中心极限定理分别计算同一问题。,250,68,5、某商店负责所在地区1000人的商品供应, 某种商品在一段时间内每人需用一件的概率为0.6, 假定在这一段时间内个人购买与否彼此无关, 问商店应预备多少件这种商品,才能以99.7%的 概率保证不会脱销。,643,6两个影院为了1000个顾客而竞争,假设每个顾客 去某一个电影院完全是无所谓的,并且不依赖于 其他顾客的选择,为了使任何一个顾客由于缺少 座位而离去的概率小于1%,每一个电影院应该有多少个座位?,19.1),