《统计学7章ppt课件.ppt》由会员分享,可在线阅读,更多相关《统计学7章ppt课件.ppt(64页珍藏版)》请在三一文库上搜索。
1、第七章 推断统计,统计抽样和参数估计,2019/8/1,第七章 推断统计,2,第一节 抽样推断的基本概念,一、抽样推断的含义 抽样推断,也称统计抽样,是在抽样调查的基础上,利用样本的实际资料计算样本指标,并据此推算总体相应数量特征的一种统计分析方法。 抽样推断就是根据样本的平均数、成数(也称比率)来推断经济社会现象指标总体的平均数和相对数(成数)。,2019/8/1,第七章 推断统计,3,二、抽样推断的特点,抽样推断是由部分(样本)来推断总体的一种认识方法 抽样推断是建立在科学原则(随机原则抽样)基础上的 抽样推断运用的是概率估计的方法 抽样推断的误差是可以事先计算并加以控制的,2019/8/
2、1,第七章 推断统计,4,三、抽样推断的作用,用更少的人力、时间、费用来达到对总体的认识 解决不能进行全面调查的检验问题 对普查质量进行检查和修正:主要是修正登记性误差 应用于时间紧迫不可能取得全面资料时的分析研究,2019/8/1,第七章 推断统计,5,四、抽样推断的内容,参数估计:依据所获得的样本观察资料,对所研究对象总体的水平、结构、规模等数量特征进行估计。 假设检验:依据样本观察资料对总体综合指标的某种假设检验,来判断这种假设的真伪。,2019/8/1,第七章 推断统计,6,第二节 有关抽样的基本概念,一、总体的相关概念 (一)总体 一般用 N 表示总体的单位数。 一个总体的指标数值是
3、确定的、唯一的,所以称为参数。,2019/8/1,第七章 推断统计,7,(二)总体参数,1、总体的平均数与方差 总体平均数 对未整理资料: 对经过整理的资料:,是唯一的、确定的。,2019/8/1,第七章 推断统计,8,对未整理资料: 或 对经过整理的资料: 或,总体的方差(或标准差):,无法直接求得,2019/8/1,第七章 推断统计,9,2、总体的成数和方差:,2019/8/1,第七章 推断统计,10,二、样本的相关概念,1、样本容量与样本个数 样本容量:样本容量是指一个样本包含的单位数。一般用 n 表示。 样本个数:又称样本可能数目,是指从一个总体可能抽取的样本个数。样本个数的多少与抽样
4、方法有关。,2019/8/1,第七章 推断统计,11,2、样本统计量,样本总体的指标数值是个随机变量,所以称为样本统计量或样本估计量。 样本统计量是样本的一个函数。,可通过样本资料求得。,2019/8/1,第七章 推断统计,12,(1)样本的均值与方差:,或,或,2019/8/1,第七章 推断统计,13,(2)样本的成数与方差:,2019/8/1,第七章 推断统计,14,三、抽样的组织方式,(一)简单随机抽样(纯随机抽样) 1、重复抽样 也称回置抽样,它是指每次抽取一个样本登记后再将它放回总体中参加下一次抽取。 重复抽样的特点是:每次抽取样本是在完全相同的条件下进行的,总体中每个单位中选的机会
5、在各次都完全相等。 从总体 N 个单位中,用重复抽样的方法,随机抽取一个容量为 n 的样本,则我们共可抽取 Nn 个样本。,2019/8/1,第七章 推断统计,15,2、不重复抽样,也称不回置抽样,它是指每次抽取一个样本登记后不再放回总体中参加下一次抽取。 每一个样本单位只有一次被抽取的可能。 特点:样本由连续 n 次抽取的结果构成,实质上等于一次同时从总体中抽取 n 个样本单位。 从总体 N 个单位中,全部可能抽取的样本数目为N(N-1)(N-2)(N-n +1)个容量为 n 的样本。,2019/8/1,第七章 推断统计,16,(二)等距抽样(又称机械抽样、系统抽样),先根据某一标志对总体各
6、单位进行排队,然后按一定顺序和间隔来抽取样本单位的一种抽样组织方式。 等距抽样一般都是不重复抽样。 等距抽样时总体各单位排序的标志,可以是无关标志,也可以是有关标志。(见下页),2019/8/1,第七章 推断统计,17,1、无序等距抽样,按无关标志排队进行等距抽样。 抽样距离:k=N/n 所谓无关标志,是指和单位标志值的大小无关或不起主要作用的标志。如时间顺序或地理位置。 所谓有关标志,就是作为排序的标志与单位标志值的大小有密切的关系。如工资收入、学生成绩。,第一组随机抽取一个,以后每隔k个抽取一个。,2019/8/1,第七章 推断统计,18,2、有序等距抽样,按有关标志排队进行等距抽样。 可
7、分为: 半距起点等距抽样: 对称等距抽样(常用):假定第一组随机抽取第 a 个,则第二组起分别为:2k-a,2k+a,4k-a,4k+a,6k-a,6k+a,,第一组抽第k/2个,以后每隔k个抽取一个。,2019/8/1,第七章 推断统计,19,(三)类型抽样(又称分层抽样),类型抽样:是将总体各单位按主要标志进行分组,然后再从各组中按随机原则抽取一定比例的单位构成样本。 类型抽样的特点是把分类法和随机原则结合起来。由于它是按一定比例在每一组中抽样,所以不存在组间误差。在分组时应尽量将变异较小的同类单位归入一组,通过扩大组间差异来达到缩小组内差异的目的,所以其抽样误差一般小于简单随机抽样的误差
8、。,2019/8/1,第七章 推断统计,20,续前:,类型抽样分组时,各组单位数可多可少,但各组的抽样比例最好保持相同,以避免各组抽样比例不同而引起的误差。 式中:Ni 表示各组单位数;ni 表示分配到各组的抽样单位数目。,2019/8/1,第七章 推断统计,21,(四)整群抽样,整群抽样也称整组抽样,它是将总体各单位划分成若干群,然后从中随机抽取部分群,并对选中群的所有单位进行全面调查的抽样组织方式。,2019/8/1,第七章 推断统计,22,四、抽样平均数的分布规律及和总体分布的关系,1、抽样平均数的分布规律 以相同的样本容量 n,从总体中重复地抽取很多样本,每个样本有一个平均数,这一系列
9、平均数: 就组成了一个抽样平均数的总体。,思考一下:有多少个?,2019/8/1,第七章 推断统计,23,续前:,根据中心极限定理,如果总体为N( )时,抽样平均数 准确地服从N( )正态分布, 而不论样本容量 n 的大小,都是如此。 如果不知道原来的总体是否为正态分布,只要样本容量 n 的足够大(一般不小于30),则抽样平均数 近似地服从 N( )正态分布。,2019/8/1,第七章 推断统计,24,续前:,抽样分布平均数: 式中: 为抽样平均数,A 为总体中抽出的所有样本可能数目。,2019/8/1,第七章 推断统计,25,2、结论,(1)所有抽样平均数的平均数等于总体平均数:,2019/
10、8/1,第七章 推断统计,26,(2)抽样平均数的标准误差 (有别于总体分布在标准差的叫法),重复抽样情况: 不重复抽样情况:,注:不重复抽样排除了“每次抽出都是极端值”的可能,因此平均误差要比重复抽样小。但当N远大于n时,可以都按重复抽样处理。,不重复抽样:修正系数,实际上是很难计算的,2019/8/1,第七章 推断统计,27,五、抽样成数的分布规律,1、抽样成数的平均数等于总体成数,2019/8/1,第七章 推断统计,28,2、抽样成数的标准误差,重复抽样情况:,不重复抽样情况:,2019/8/1,第七章 推断统计,29,第三节 抽样误差,一、抽样误差的含义 1、抽样误差( ) 是指由于随
11、机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标的绝对离差。 抽样误差不是由调查失误所引起的,而是随机抽样所特有的误差。 抽样误差是一种代表性误差。 抽样误差是不可能计算的,但可以通过抽样设计,把它缩小到最低限度,或控制在调查要求的允许范围之内。,2019/8/1,第七章 推断统计,30,2、影响抽样误差大小的因素,总体各单位标志值的变异程度 样本单位数 抽样方法和抽样组织方式,2019/8/1,第七章 推断统计,31,二、简单随机抽样的平均误差,抽样平均误差是反映抽样误差一般水平的指标。是所有可能抽取的样本平均数或成数的标准差。 由于所有样本平均数的平均
12、数正好等于总体平均数,而所有样本成数的平均数正好等于总体成数,因此,抽样平均数或成数的标准差恰好反映了抽样平均数或成数与总体平均数或成数的平均离差程度。,2019/8/1,第七章 推断统计,32,(一)重复抽样条件下 平均数的抽样平均误差,重复抽样的条件下,抽样平均数的平均误差和总体变异程度、样本容量有关,与总体单位数的多少无关。 它们的关系如下:,式中: 表示平均数的抽样平均误差,与前述的标准误差 ( )同义。 表示总体标准差;n表示样本容量。S为样本均值的修正标准差。,2019/8/1,第七章 推断统计,33,(二)不重复抽样条件下平均数的抽样平均误差,注意上式中方差的应用: (1)当小样
13、本条件下(n 30): (2)当大样本条件下:,修正方差,N很大时,2019/8/1,第七章 推断统计,34,(三)成数的抽样平均误差,1、重复抽样情况:,2、不重复抽样情况:,N很大时,示例,2019/8/1,第七章 推断统计,35,三、等距抽样的平均误差,一般按简单不重复随机抽样的抽样平均误差公式来代替。,2019/8/1,第七章 推断统计,36,四、分类抽样的平均误差,由于各组样本单位数不同,所以在计算样本总的平均数、成数和各组组内方差的平均数时,要以各组单位数为权数进行加权平均。即:,式中:f 表示各组单位数; f = n 表示样本容量,S2 样本各组的组内方差。,代替总体 方差2,2
14、019/8/1,第七章 推断统计,37,1、在重复抽样条件下,抽样平均误差的计算公式:,2019/8/1,第七章 推断统计,38,2、不重复抽样条件下,抽样平均误差的计算公式:,示例,不重复抽样:修正系数,2019/8/1,第七章 推断统计,39,五、整群抽样的平均误差,整群抽样实质是以各群代替各单位之后的简单随机抽样。所以它只存在群间方差,不存在群内方差。 整群抽样对整群作了全面调查,并以群平均数作为每一群的标志值,而各群平均数的方差正是群间方差。 我们只讨论各群单位数相同的情况。这样各群平均数的平均数、各群平均数的方差,只需用简单算术平均法计算就可以了。,2019/8/1,第七章 推断统计
15、,40,1、样本平均数计算,设将总体的全部单位N划分成R群,每群包括m个单位。再从R群中随机抽取 r 群构成一个样本。(整群抽样都是采用不重复抽样方法) 则:,式中: 表示样本各群平均数; 表示各群平均数的平均数。,2019/8/1,第七章 推断统计,41,2、样本群间方差2 的计算,小样本情形:,用此代替总体方差2,大样本情形:,2019/8/1,第七章 推断统计,42,3、整群抽样平均误差计算,用总体群数R来替代总体单位数N,用样本群数 r 来替代样本单位数 n。 计算公式:,不重复抽样:修正系数,示例,2019/8/1,第七章 推断统计,43,4、成数的样本群平均数和样本群间方差,或:,
16、2019/8/1,第七章 推断统计,44,5、成数的整群抽样平均误差,示例,2019/8/1,第七章 推断统计,45,第四节 参数估计的方法,参数估计就是指利用实际调查计算的样本指标值来估计相应的总体指标的数值。 总体指标是表明总体数量特征的参数,所以称为参数估计。 总体参数估计有点估计和区间估计两种,其中区间估计是体现抽样估计科学性的主要参数估计方法。,2019/8/1,第七章 推断统计,46,一、优良估计标准,1、无偏性 要求在总体中所有可能抽取的样本统计量的平均数应等于被估计的总体参数。 2、一致性 就是要求当样本容量 n充分大时,样本统计量也充分靠近总体参数。 3、有效性 就是要求作为
17、优良估计量的方差应该比其他估计量的方差小。,2019/8/1,第七章 推断统计,47,二、总体参数的点估计,点估计又称定值估计、直接估计,它是直接以样本统计量作为相应总体参数的估计量。 即用 表示总体的估计值,则:,示例,2019/8/1,第七章 推断统计,48,三、总体参数的区间估计,(一)抽样极限误差的概念 抽样极限误差是指在一定概率条件下抽样误差的可能范围,也称允许误差。 用 、 分别表示平均数和成数的抽样极限误差。即:,和,2019/8/1,第七章 推断统计,49,置信度: 1 -,抽样极限误差的抽样误差的可能范围而不是完全肯定的范围,且这个可能范围的大小是与可能性的大小即概率紧密联系
18、的。 抽样极限误差越大,总体参数落在估计区间的概率就越大; 越小,总体参数落在估计区间的概率就越小。这个概率叫置信度,用1- 表示,其是被称为估计误差的显著性水平,简称显著性水平。,2019/8/1,第七章 推断统计,50,(二)概率度与概率之间的数学关系,概率度:是一个确定估计区间的度量值。 正态分布条件下,概率度与概率之间的关系如下表:,2019/8/1,第七章 推断统计,51,(三)区间估计的基本公式,1、大样本条件下 在大样本的条件下,样本平均数的分布接近于N( )的正态分布。因此,若给(1),可以由正态分布表求得概率度 t ,使 在区间( )的概率为(1)。即:,2019/8/1,第
19、七章 推断统计,52,所以:,给定概率(1),平均数的抽样极限误差 的计算公式为:,2019/8/1,第七章 推断统计,53,同样地:,给定概率(1), 成数的抽样极限误差 的计算公式为:,示例,2019/8/1,第七章 推断统计,54,2、小样本条件下,计算公式同上。 但是,给定概率(1-)应通过自由度为(n-1)的 t 分布中来确定概率度 t 。,2019/8/1,第七章 推断统计,55,(四)区间估计的方法,1、给定概率保证程度求抽样极限误差 即:在给定概率保证程度(1)条件下,已知 t、,求抽样极限误差 。,练习题1,2019/8/1,第七章 推断统计,56,2、给定抽样极限误差求概率
20、保证程度,即在公式 中,已知、,求 t。,练习题2,2019/8/1,第七章 推断统计,57,3、给定抽样极限误差和概率保证程度推算必要的样本容量,给定抽样极限误差和概率保证程度推算样本容量,就是在公式 中,已知、t,求计算公式中所包含的 n。 以下都以简单随机抽样为例。,2019/8/1,第七章 推断统计,58,(1)在重复抽样条件下,平均数的抽样极限误差 : 则必要的样本容量为:,示例,2019/8/1,第七章 推断统计,59,(2)在不重复抽样条件下,平均数的抽样极限误差 : 则必要的样本容量为:,2019/8/1,第七章 推断统计,60,(3)成数样本必要单位数,重复抽样: 不重复抽样
21、:,练习题3,2019/8/1,第七章 推断统计,61,分析:,从上式可以看出,样本必要单位数受允许误差范围的制约,允许误差范围愈小,则要求样本容量愈多。 以重复抽样来说,若其他条件不变,允许误差范围缩小一半,则样本容量必须增至原来的四倍;允许误差范围扩大一倍,则样本容量只需为原来的四分之一。,2019/8/1,第七章 推断统计,62,四、抽样方案的检查,1、准确性检查 所谓准确性检查,就是以方案所要求的允许误差范围为标准,用已掌握的资料检查其在一定概率保证下,实际的极限误差是否超过方案所允许的误差范围。,2019/8/1,第七章 推断统计,63,2、代表性检查,所谓代表性检查,就是将方案中的样本指标与过去已掌握的总体同一指标进行对比,视其比率是否超过规定。如规定农产品的比率不超过2%,居民收入不超过3%等。,2019/8/1,第七章 推断统计,64,本章主要问答题,什么是抽样推断?它有哪些基本特征? 什么是重复抽样和不重复抽样?它们各有什么特点? 什么是抽样误差?影响抽样平均误差的因素有哪些? 什么是代表性误差? 代表性误差有几种?各有什么特点? 类型抽样和整群抽样在分组时有什么不同的要求? 抽样平均误差、抽样极限误差和概率度三者之间的关系? 抽样组织方式主要有哪几种?比较各种抽样组织方式的抽样平均误差大小。 在一定的置信度和误差范围条件下,如果确定样本容量?,
链接地址:https://www.31doc.com/p-3217686.html