喀什师范学院笔记抽样调查的原理与方法第三章简单随机抽样.ppt
《喀什师范学院笔记抽样调查的原理与方法第三章简单随机抽样.ppt》由会员分享,可在线阅读,更多相关《喀什师范学院笔记抽样调查的原理与方法第三章简单随机抽样.ppt(67页珍藏版)》请在三一文库上搜索。
1、第三章 简单随机抽样,2,本章要点,简单随机抽样是抽样中最基本、最成熟、也 是最简单的抽样设计方式,是所有概率抽样方法 发展、比较的基础。 要求通过学习熟练掌握简单随机抽样的抽 样方式和样本抽选方法; 熟知总体均值、总体总值和总体比例的简 单估计; 掌握样本量的确定;了解子总体的估计。,3,第一节 抽样方式,4,简单随机抽样也称纯随机抽样。对于大小为的总 体,抽取样本量为的样本,若全部可能的样本被抽中 的概率都相等,则称这样的抽样为简单随机抽样。根 据抽样单位是否放回可分为放回简单随机抽样和不放 回简单随机抽样。,(一)放回简单随机抽样,(二)不放回简单随机抽样,(三)不放回与放回简单随机抽样
2、的比较,一、什么是简单随机抽样,5,(一)放回简单随机抽样,如果抽样是有放回的,那么每次抽取都都是从 个 总体单位中抽取,这时可能的样本为 个(考虑样本 单位的顺序)或 个(不考虑样本单位的顺序), 每个样本被抽中的概率为 或 ,这种抽样方式 就是放回简单随机抽样,所得的样本称为放回的简单 随机样本。考虑与不考虑样本单位顺序的放回简单随 机抽样,有一个共同的特点,即同一个单位有可能在 同一个样本中重复出现。但是他们也有明显的区别: 一是可能的样本数不同;二是样本的概率分布不同, 由此会导致估计量的概率分布不同。,6,可以证明,不考虑顺序的放回简单随机抽 样的估计量的方差大于等于考虑顺序的放回简
3、 单随机抽样的估计量的方差,因此在抽样实践 中,若用到放回简单随机抽样这种方式,也只 讨论和使用考虑顺序的情形。,7,(二)不放回简单随机抽样,如果抽样是无放回的,即同一个单位不能 在样本中重复出现,那么,若考虑样本单位的 顺序,则可能的样本为 个,每个样本被抽 中的概率为 ;若不考虑样本单位的顺序, 则可能的样本为 个,每个样本被抽中的概率 为 。这样的抽样方式就是不放回简单随机 抽样,所得的样本称为不放回简单随机样本。,8,考虑样本单位顺序与不考虑样本单位顺序的不放回 简单随机抽样,除了单位不可能在同一个样本中重复 出现这一共同特点外,还有一个共同点,即虽然他们 的可能样本数不同,考虑顺序
4、是不考虑顺序的 倍, 但是它们的样本却有相同的概率分布。由此会导致依 据样本构造的估计量的概率分布也是相同的。 由于这一共同点的存在,加之不考虑顺序的放回简 单随机抽样的工作量更小,所以抽样实践中对于不放 回简单随机抽样,只讨论和使用不考虑顺序不放回简 单随机抽样这种方式。,9,(三)不放回与放回简单随机抽样的比较,1、每次抽取样本单位面对的总体结构不同。这是二者的主要不同之处。这一点使得前者的数学处理相对简单。 2、样本提供的信息量不同。显然,在样本量一定的条件下,由于后者提供的信息量大于前者,其抽样效率更高。 在实践中,一般多采用不考虑顺序的不放回简单随机抽样,所以以下讨论如无特别说明,都
5、指这一类简单随机抽样。,10,二、简单随机样本的抽选方法,简单随机样本的抽选,首先要将总体 个单位从1到 编号,每个单位对应一个号;然后从所编的号中抽号,如果抽到某个号,则对应的那个单位入样,直到抽够 个单位为止。 (一)抽签法 (二)随机数法,11,(一)抽签法,当总体不大时,可分别采用两种方法抽取。一种是全样本抽选法,另一种是逐个抽选法,按这两种方法抽到的 个单位的样本是等价的,每个被抽到的样本的概率都等于 。,12,(二)随机数法,当总体较大时,抽签法实施起来比较困难,这时可以利用随机数表、随机数骰子、摇奖机、计算机产生的伪随机数进行抽样。,1、利用随机数表进行抽选。 随机数表是一张由0
6、,1,2,9这十个数字组成的,一般常用的是五位数的随机数字表,10个数字在表中出现的顺序是随机的,每个数字都有同样的机会被抽中。,13,用随机数表抽选简单随机样本时,一般可根据总体大小 的位数决定在随机数表中随机抽取几列,比如 =768,要从中抽取 =10的简单随机样本,则在随机数表中随机抽取相邻的3列,顺序往下(或往上),选出前10个001到768之间的互不相同的数,如果这3列随机数字不够,可另选其他3列继续,直到抽够个 单位为止。,14,用此种方法,当 的最高位数较小,比如小于5,且不小 时,由于读到的随机数被舍弃不用的比例较大,抽选效率较差。此时采用下面的方法。在随机数表中随机抽取3列,
7、顺序往下,如果得到的随机数大于247,小于989(因为247的4倍为988,因此000及989到999的数字应舍弃),则用这个数除以247,得到的余数入样,显然这种方法效率要高得多。随机数表的起始页和起始点都应用随机数产生。,15,3、利用摇奖机进行抽选。 4、利用计算机产生的伪随机数进行抽选。通常产生的伪随机数有循环周期。因此在有条件的情况下,一般不建议使用此种方法。,2、利用随机数骰子进行抽选。,16,(一)简单随机抽样在抽样理论中的地位 它是抽样中最容易掌握的技术、也是发展最成熟的技术,建立了最完备的理论。简单随机抽样也是比较其他抽样设计方法优劣的基础。其他抽样方法技术都是在它的理论技术
8、基础上,针对它的局限发展起来的。,三、简单随机抽样在抽样理论中的地位 与局限性,17,若总体单位数 很大时,编制抽样框困难;抽样框中即使有辅助信息也不加利用,使得估计的统计效率较其他利用辅助信息的抽样设计方法低;由于样本在总体中的地理分布范围较广,如果采取面访,则费时、费钱、费力,困难较大;可能得到一个“差”的简单随机样本;若不用计算机,而用随机数表或随机数骰子抽取一个大样本,比较劳神单调。,(二)简单随机抽样的局限性,18,四、有关指标与符号,19,第二节 总体均值与总体总值 的简单估计,20,(一)简单估计量的定义,(三)简单估计量 的方差,(四)简单估计量 的方差的无偏估计,(二)简单估
9、计量 的无偏性,(五)放回简单随机抽样的简单估计,(六)设计效应,(七)影响估计量精度的因素,一、总体均值的简单估计,21,(一)简单估计量的定义,对于简单随机抽样,最简单的估计是利用样本均值作为总体均值的估计,即总体均值的简单估计量为:,也就是说,样本均值是总体均值的简单估计量。,22,(二)简单估计量 的无偏性,对于简单随机抽样, 是 的无偏估计,即有,证明:,这就是对称性论证法。由于总体中每一个单位的入样概率都相等,所以不放回简单随机抽样是一种等概率抽样。,23,(三)简单估计量 的方差,式中, 抽样比; 为有限总体校正系数。,证明:,根据对称性论证法,有,24,因此有,25,(四)简单
10、估计量 的方差的无偏估计,的无偏估计是:,式中 为样本方差。,证明:,26,根据对称性论证法及 的表达式,有,由此可得:,27,(五)放回简单随机抽样的简单估计,现实中有许多情况下,抽样必须是放回的, 即从总体中抽中的单位每次都要放回总体中去。 例如在城市中对行人、车辆的调查,对超市顾 客、影剧院观众的调查等抽样都是有放回的, 从而,有可能重复抽中某些单位。,对于每次抽到的结果(视为随机变量) 都有,28,由此可以证明:,注意到,29,因此样本方差,是无限总体方差 的无偏估计量。,方差 的一个无偏估计是:,考虑样本单位顺序的放回简单随机抽样也是 等概率抽样。,30,这说明除非 =1,否则在相同
11、的样本量下,放回简单随机抽样的方差总是大于不放回的方差,即它的抽样效率一般比不放回简单随机抽样的低。,根据抽样设计效应定义:,放回简单随机抽样的 为:,31,【例3-3】为调查某大学学生的电信消费水平,在全校=15230名学生中,用简单随机抽样的方法抽得一个=36的样本。对每个抽中的学生调查其上个月的电信支出金额(如表3-6所示)。试以95%的置信度估计该校大学生该月电信消费的平均支出额。,32,, , , , , 。 因此,对该校大学生某月的电信消费的人均支出额的估计为53.64(元),由于置信度95%对应的 =1.96,所以,可以以95%的把握 说该校大学生该月的电信消费的人均支出额大约在
12、53.641.966.1355,即41.6165.67元之间。 若采取放回简单随机抽样,则: , , ,以95%的把握估计该校大学生该月的电信消费的人均支出额大约在53.641.966.1428,即41.6065.68元之间。 计算结果说明,不放回比放回简单随机抽样估计的置信区间略小一些。由于总体较大而抽样比较小,所以两者之间相差很小。,解:依据题意和表中数据,可计算得:,33,总体总值为总体均值的 倍,即,(一)简单估计量的定义 N倍的样本均值是总体总值的简单估计量, 即,二、总体总值的简单估计,只要我们有了总体均值的估计结果,就可以很容易地推出总体总值的估计结果。,34,由于总体总值是总体
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 喀什 师范学院 笔记 抽样调查 原理 方法 第三 简单 随机 抽样
链接地址:https://www.31doc.com/p-2147841.html