现代社会调查方法之抽样.ppt
《现代社会调查方法之抽样.ppt》由会员分享,可在线阅读,更多相关《现代社会调查方法之抽样.ppt(87页珍藏版)》请在三一文库上搜索。
1、章 第四章 抽样 抽样 目的要求目的要求掌握掌握概率抽样的原理、程序与方法概率抽样的原理、程序与方法;掌握掌握抽样误差的概念与测量方法抽样误差的概念与测量方法;熟悉熟悉非概率抽样方法与样本规模非概率抽样方法与样本规模;了解了解抽样的意义抽样的意义;目录目录抽样的意义与作用抽样的意义与作用1概率抽样的原理与程序概率抽样的原理与程序2概率抽样方法概率抽样方法3非概率抽样方法非概率抽样方法4样本规模与抽样误差样本规模与抽样误差5以上现象是否说明了这以上现象是否说明了这样一个道理:样一个道理:我们可以通过对部分的我们可以通过对部分的观察来推论总体的情况。观察来推论总体的情况。“管中窥豹,可见一斑管中窥
2、豹,可见一斑”“一叶知秋一叶知秋”在日常生活当中所熟在日常生活当中所熟知的抽样有哪些?知的抽样有哪些?一、抽样的意义与作用(一一)抽样的意义抽样的意义 人们在研究某个自然现象或社会现象时,往往会遇到人们在研究某个自然现象或社会现象时,往往会遇到不方便、不可能或不必要对所有的对象作调查的情况,不方便、不可能或不必要对所有的对象作调查的情况,于是从中抽取一部分对象作调查,这就是于是从中抽取一部分对象作调查,这就是抽样抽样.复杂的社会现象复杂的社会现象 有限的研究资源有限的研究资源 抽样主要涉及和处理有关抽样主要涉及和处理有关总体与部分之间的关系总体与部分之间的关系问题。问题。抽样作为人们从部分认识
3、整体这一过程的关键环节,其抽样作为人们从部分认识整体这一过程的关键环节,其基本作用是向人们提供一种实现基本作用是向人们提供一种实现“由部分认识总体由部分认识总体”这这一目标的一目标的途径和手段途径和手段。抽样抽样(二)抽样的作用(二)抽样的作用 抽样是社会研究的主要内容之一,也是社会调查抽样是社会研究的主要内容之一,也是社会调查的一个重要步骤。的一个重要步骤。它与研究目的及研究内容紧密相关。它与研究目的及研究内容紧密相关。它直接关系到资料的收集、整理与分析。它直接关系到资料的收集、整理与分析。它还涉及到整个研究的费用以及应用的范围。它还涉及到整个研究的费用以及应用的范围。抽样是否科学,直接关系
4、到研究的成败抽样是否科学,直接关系到研究的成败一、抽样的意义与作用一、抽样的意义与作用(三)抽样的相关概念(三)抽样的相关概念抽样(抽样(samplingsampling):从组成某个总体的所有元素的集合中,从组成某个总体的所有元素的集合中,按一定的方式选择或抽取一部分元素的过程。按一定的方式选择或抽取一部分元素的过程。总体(总体(populationpopulation):构成它的所有元素的集合构成它的所有元素的集合例:四川省应届毕业生择业倾向调查。通常用例:四川省应届毕业生择业倾向调查。通常用N N表示表示样本(样本(samplesample)从总体中按一定方式抽取出的一部分元从总体中按一
5、定方式抽取出的一部分元素的集合。素的集合。例:例:12.812.8万名应届毕业生中抽取万名应届毕业生中抽取10001000名大学生。通常用名大学生。通常用n n表表示示一、抽样的意义与作用一、抽样的意义与作用抽样单位(抽样单位(sampling unitsampling unit)一次直接的抽样所使用的基本单一次直接的抽样所使用的基本单位。位。抽样单位与构成总体的元素有时是相同有时又不同。抽样单位与构成总体的元素有时是相同有时又不同。如如12.812.8万大学生,当以万大学生,当以10001000名大学生作为样本时?当以名大学生作为样本时?当以4040个班个班级作为样本时?级作为样本时?抽样框
6、抽样框(sampling framesampling frame)抽样范围,指一次直接抽样时总抽样范围,指一次直接抽样时总体中所有抽样单位的名单体中所有抽样单位的名单 。例:从一所中学的全体学生中抽取例:从一所中学的全体学生中抽取200200名学生作为调查样本。名学生作为调查样本。从一所中学的所有班级中抽取从一所中学的所有班级中抽取2020个班级作为调查样本。个班级作为调查样本。参数值(参数值(parameterparameter)是对总体中某一变量的综合描述,或总是对总体中某一变量的综合描述,或总体中所有元素某些特征的综合数量表现。最常见的参数值是总体中所有元素某些特征的综合数量表现。最常
7、见的参数值是总体某一变量的平均值。体某一变量的平均值。参数值只有对总体中的每一个元素进行参数值只有对总体中的每一个元素进行调查或测量才能得到。调查或测量才能得到。例:某市待业青年平均年龄,某工厂工人的平均收入。例:某市待业青年平均年龄,某工厂工人的平均收入。一、抽样的意义与作用一、抽样的意义与作用统计值(统计值(statisticstatistic)是对样本中某一变量的综合描述,或是对样本中某一变量的综合描述,或样本中所有元素某些特征的综合数量表现。根据样本计算出样本中所有元素某些特征的综合数量表现。根据样本计算出来的关于样本变量的数量表现来的关于样本变量的数量表现 。统计值是从样本中计算出来
8、的,它是相应的参数值的估计值。统计值是从样本中计算出来的,它是相应的参数值的估计值。参数值:确定的、唯一的、未知的。参数值:确定的、唯一的、未知的。统计值:变化的。统计值:变化的。置信度(置信度(confidence levelconfidence level)总体参数值落在样本统计值总体参数值落在样本统计值某一区间内的概率,或者说,是总体参数值落在样本统计值某一区间内的概率,或者说,是总体参数值落在样本统计值某一区间内的把握性程度。某一区间内的把握性程度。反映的是样本的可靠性程度。如置信水平为反映的是样本的可靠性程度。如置信水平为95%95%,则表示总,则表示总体参数值落在样本统计值某一区间
9、的概率为体参数值落在样本统计值某一区间的概率为95%95%。置信区间(置信区间(confidence intevalueconfidence intevalue)上述上述“某一区间某一区间”,就是置信区间。指在一定置信水平下,样本统计值与总体,就是置信区间。指在一定置信水平下,样本统计值与总体参数值之间的误差范围。与误差范围成正比。参数值之间的误差范围。与误差范围成正比。一、抽样的意义与作用一、抽样的意义与作用依据概率论的基本原依据概率论的基本原理,按照理,按照等概率原则等概率原则进行的抽样,能够进行的抽样,能够避避免免抽样过程中的抽样过程中的人为人为误差误差,保证样本的代,保证样本的代表性表
10、性依据研究者的依据研究者的主观意主观意愿、判断或是否方便愿、判断或是否方便等因素来抽取对象,等因素来抽取对象,往往产生较大误差,往往产生较大误差,难以保证样本的代表难以保证样本的代表性。性。(四)抽样的类型(四)抽样的类型根据抽取对象的具体方式分类:根据抽取对象的具体方式分类:概率概率抽样抽样非概非概率抽样率抽样一、抽样的意义与作用一、抽样的意义与作用抽样方法抽样方法概率抽样非概率抽样简单随机抽样系统抽样分层抽样整群抽样多段抽样偶遇抽样判断抽样定额抽样雪球抽样(一)概率抽样的基本原理(一)概率抽样的基本原理1.1.无意识抽样导致的偏差无意识抽样导致的偏差方便获取的样本:易得,但缺乏代表性方便获
11、取的样本:易得,但缺乏代表性;例如:如何获取由例如:如何获取由100100个学生构成的样本个学生构成的样本访问者的偏好影响样本的代表性访问者的偏好影响样本的代表性;例如:有意回避具有某些特例如:有意回避具有某些特(“酷酷”、“冷冷”)的受访者的受访者抽样的地点影响样本的代表性抽样的地点影响样本的代表性 例如:图书馆门口访问例如:图书馆门口访问二、概率抽样的原理与程序二、概率抽样的原理与程序(一)概率抽样的基本原理(一)概率抽样的基本原理2.2.同质性和异质性同质性和异质性 买买100100支单价为支单价为1 1元的铅笔,在结账的时候是用乘元的铅笔,在结账的时候是用乘法还是加法?法还是加法?买买
12、1010支单价为支单价为1 1元的铅笔、元的铅笔、2020支单价为支单价为2 2元的签字元的签字笔和笔和3030支单价为支单价为5 5元的钢笔,结账时该如何计算?元的钢笔,结账时该如何计算?10*1+20+2+30*510*1+20+2+30*5100100铅笔具有同质性,铅笔具有同质性,6060支笔具有异质性(价格不支笔具有异质性(价格不同)同)二、概率抽样的原理与程序二、概率抽样的原理与程序是否可以这样认为是否可以这样认为是否可以这样认为是否可以这样认为?对于具有同质性的总体,我们只需要了解其中一个成员,就对于具有同质性的总体,我们只需要了解其中一个成员,就能知道整个群体的情况;对于具有异
13、质性总体,我们往往需能知道整个群体的情况;对于具有异质性总体,我们往往需要根据总体内部的不同特征选取一定数量具有代表性的样本要根据总体内部的不同特征选取一定数量具有代表性的样本来推论总体的情况。来推论总体的情况。例:西南医科大学在校生网购情况分析例:西南医科大学在校生网购情况分析研究总体:研究总体:西南医科大学在校大一、大二、大三学生西南医科大学在校大一、大二、大三学生是否具有同质性?是否具有同质性?否,不同经济状况、消费观念会导致不同的网购行为否,不同经济状况、消费观念会导致不同的网购行为采用抽样调查:选取采用抽样调查:选取100100个具有代表性的样本来推论西南个具有代表性的样本来推论西南
14、医科大学在校生的网购情况。医科大学在校生的网购情况。什么样的样本才能代表总体的情况?什么样的样本才能代表总体的情况?什么样的样本才能代表总体的情况?什么样的样本才能代表总体的情况?从年级分类:大一、大二、大三从年级分类:大一、大二、大三从年级分类:大一、大二、大三从年级分类:大一、大二、大三从学院分类:药学院、法学院、公共卫生学院。从学院分类:药学院、法学院、公共卫生学院。从学院分类:药学院、法学院、公共卫生学院。从学院分类:药学院、法学院、公共卫生学院。从性别分类:男、女从性别分类:男、女从性别分类:男、女从性别分类:男、女采用概率抽样抽取的样本为什么能代表总体的情采用概率抽样抽取的样本为什
15、么能代表总体的情采用概率抽样抽取的样本为什么能代表总体的情采用概率抽样抽取的样本为什么能代表总体的情况?况?况?况?(二)抽样分布(二)抽样分布 抽样分布是根据概率的原则而成立的理论分布,它显示出:从一个总体中不断抽取样本时,各种可能出现的样本统计值的分布情况。二、概率抽样的原理与程序二、概率抽样的原理与程序当样本容量为当样本容量为2 2个时,根据组合公式计算总共可以抽取个时,根据组合公式计算总共可以抽取4545个不同的样个不同的样本,这些样本的平均数范围从本,这些样本的平均数范围从6.56.5年(当)到年(当)到14.514.5年,其中会产生一年,其中会产生一些相同的平均数,比如些相同的平均
16、数,比如6-146-14,7-137-13,8-128-12,9-119-11这四个样本的平均数这四个样本的平均数都是都是1010年。年。当样本容量为当样本容量为3 3个时,可以抽取个时,可以抽取120120个样本,这些样本的平个样本,这些样本的平均数范围从均数范围从7 7年到年到1414年,其中相同的平均数更多。年,其中相同的平均数更多。当样本容量继续增大时(越来越接近总体的当样本容量继续增大时(越来越接近总体的1/21/2时),样本平均数的分布会进一步发生变时),样本平均数的分布会进一步发生变化。化。趋势是:平均数的范围将逐步缩小(即分布图趋势是:平均数的范围将逐步缩小(即分布图的底部越来
17、越窄);的底部越来越窄);相同的平均数相同的平均数会相应会相应增多增多;全部平均数的分布全部平均数的分布向总体平均数集中向总体平均数集中的趋势也的趋势也会越来越会越来越明显明显。根据根据“中心极限定理中心极限定理”,当,当n n(抽取的样本量)足够大(抽取的样本量)足够大时(通常假定大于时(通常假定大于3030),无论总体的分布如何,其样本),无论总体的分布如何,其样本平均数所构成的分布都平均数所构成的分布都趋于正态分布趋于正态分布。根据概论统计理论,正态根部曲线下的任何部分的面积根据概论统计理论,正态根部曲线下的任何部分的面积都可以用数学方法推算。这意味着,都可以用数学方法推算。这意味着,任
18、何两个数值之间任何两个数值之间的样本平均数次数所占的比例都是可以求得的。的样本平均数次数所占的比例都是可以求得的。约有约有68%的样本平均数在的样本平均数在“”这两个数值的范围内这两个数值的范围内约有约有95.46%的样本统计值落在总体参数值正负两个标准差范围内。的样本统计值落在总体参数值正负两个标准差范围内。在实际应用中,人们更多的是采用以下几个数字:在实际应用中,人们更多的是采用以下几个数字:有有90%90%落在落在 之间;之间;有有95%95%落在落在 之间;之间;如果从反面来考虑这一结论,可以得出以下推论:对于任如果从反面来考虑这一结论,可以得出以下推论:对于任何一次随机抽样来说,其样
19、本的统计值落在总体参数值正何一次随机抽样来说,其样本的统计值落在总体参数值正负负1.651.65个标准差之间的概率是个标准差之间的概率是90%90%。只要我们采用的是随机抽样的方法,就可以根据抽样分布,只要我们采用的是随机抽样的方法,就可以根据抽样分布,用样本的数值来推论总体的情况。用样本的数值来推论总体的情况。界界定定总总体体:对对从从中中抽抽取取样样本本的的总总体体范范围围与与界界限限作作明明确确的的界定界定 制制定定抽抽样样框框:依依据据已已经经明明确确界界定定的的总总体体范范围围,收收集集总总体体中中全全部部抽抽样样单单位位的的名名单单,并并通通过过对对名名单单进进行行统统一一编编号号
20、来来建立起供抽样使用的抽样框建立起供抽样使用的抽样框 决定抽样方案决定抽样方案:选择抽样方法,确定样本规模选择抽样方法,确定样本规模 实实际际抽抽取取样样本本:1.1.1.1.先先先先抽抽抽抽好好好好样样样样本本本本,再再再再调调调调查查查查 2.2.2.2.一一一一边边边边抽抽抽抽样样样样一边调查(样本规模较大时)一边调查(样本规模较大时)一边调查(样本规模较大时)一边调查(样本规模较大时)评评估估样样本本质质量量:对对对对样样样样本本本本的的的的质质质质量量量量、代代代代表表表表性性性性、偏偏偏偏差差差差等等等等进进进进行行行行初初初初步的检验和衡量步的检验和衡量步的检验和衡量步的检验和衡
21、量二、概率抽样的原理与程序二、概率抽样的原理与程序(三)抽样的一般程序(三)抽样的一般程序例:西南医科大学在校生学习倦怠的原因及影响因素的调查例:西南医科大学在校生学习倦怠的原因及影响因素的调查界定总体界定总体:所有西南医科大学在校学生所有西南医科大学在校学生制定抽样框制定抽样框:假定有假定有3 3万名在校生,则需要搜集所有万名在校生,则需要搜集所有3 3万名学万名学生名单,进行统一编号来建立起供抽样使用的抽样框。生名单,进行统一编号来建立起供抽样使用的抽样框。决定抽样方案决定抽样方案:根据实际的情况,选择合适的抽样方法,并根据实际的情况,选择合适的抽样方法,并确定样本规模。如选择简单随机抽样
22、样本规模为确定样本规模。如选择简单随机抽样,样本规模为200200人。人。抽取样本抽取样本:评估样本质量评估样本质量:对样本的代表性、偏差等进行检验对样本的代表性、偏差等进行检验在实践上可行在实践上可行可可行行性性目目的的性性最有利于研究资料最有利于研究资料的获取和最符合研的获取和最符合研究的目的究的目的与研究的可得资与研究的可得资源相适应源相适应能能够够从从样样本本自自身身计计算算出出有有效效的的估估计计值值或或抽抽样样变变动动的近似值的近似值(四)抽样设计的原则(四)抽样设计的原则美国抽样专家科什(美国抽样专家科什(kishkish)教授提出一个优秀的抽样设计应该满足)教授提出一个优秀的
23、抽样设计应该满足的四条标准:的四条标准:经济性经济性可测性可测性目的性目的性可行性可行性四条标准之间存在着一定的制约关系,甚至相互冲突。四条标准之间存在着一定的制约关系,甚至相互冲突。增加可测性增加可测性加大样本容量加大样本容量增加资源增加资源经济性减弱经济性减弱实际的抽样设计就是研究者在这四条标准中进行实际的抽样设计就是研究者在这四条标准中进行取舍和保持平衡取舍和保持平衡的过程的过程三、概率抽样的方法偶遇抽样偶遇抽样判断抽样判断抽样定额抽样定额抽样雪球抽样雪球抽样简单随机抽简单随机抽系统多层抽样系统多层抽样分层抽样分层抽样整群抽样整群抽样多段抽样多段抽样概率抽样概率抽样非概率抽样非概率抽样抽
24、样类型抽样类型概率抽样是按照概率原理进行的,它要求样本具有随机性,概率抽样是按照概率原理进行的,它要求样本具有随机性,即总体中每一个成员都有被抽中的可能性。即总体中每一个成员都有被抽中的可能性。不同形式的概率抽样对选择涉及调查研究问题的性质、良不同形式的概率抽样对选择涉及调查研究问题的性质、良好的抽样框的获得、调查研究经费的多少、资料收集方法好的抽样框的获得、调查研究经费的多少、资料收集方法等因素有不同的要求。等因素有不同的要求。三、概率抽样的方法三、概率抽样的方法(一)简单随机抽样:(一)简单随机抽样:(一)简单随机抽样:(一)简单随机抽样:又称纯随机抽样,是按照等概率原则直接从含有又称纯随
25、机抽样,是按照等概率原则直接从含有N N个元素的总个元素的总体中抽取体中抽取n n个元素组成样本(个元素组成样本(NnNn),常用的办法是抽签。概率抽),常用的办法是抽签。概率抽样的最基本形式样的最基本形式 。要点:要点:它要求被抽取样本的总体的个体数有限它要求被抽取样本的总体的个体数有限它是从总体中逐个进行抽取它是从总体中逐个进行抽取它是一种不放回抽样它是一种不放回抽样它是一种等概率抽样它是一种等概率抽样用从个体数为用从个体数为N N的总体中抽取一个容量为的总体中抽取一个容量为n n的的样本,那么每个个体被抽取的概率等样本,那么每个个体被抽取的概率等于于 方法:方法:1.1.总体较少:搅拌抽
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 现代社会 调查 方法 抽样
