《统计学课件.ppt》由会员分享,可在线阅读,更多相关《统计学课件.ppt(83页珍藏版)》请在三一文库上搜索。
1、统计学课件,项目四 统计整理 统计分组及统计图表的编制方法,教学目的与要求 通过本项目学习,首先要明确统计整理的意义和步骤,重点掌握统计分组的理论和方法,学会编制变量数列和统计表。 教学重点与难点 重点:分组标志的选择; 连续型变量的组距分组;次数分布数列的编制;权数意识的培养,正确理解权数。 难点:组距分组中组数、组距和组限的确定。,1.女,本科,讲师,月收入3500; 2.男,本科,副教授,月收入3800; 3.男,专科,讲师,月收入2600; 4.女,本科,讲师,月收入2800; 5.女,本科,副教授,月收入3900; 6.女,研究生,讲师,月收入3100; 7.男,本科,教授,月收入4
2、200; 8.女,研究生,副教授,月收入3200; 9.女,研究生,教授,月收入4300; 10.女,专科,讲师,月收入2900; 11.女,本科,讲师,月收入3100; 12.女,研究生,讲师,月收入3100; 13.男,本科,教授,月收入4500; 14.男,研究生,教授,月收入3600; 15.女,本科,讲师,月收入3500; 16.男,研究生,副教授,月收入3800; 17.男,专科,讲师,月收入2600; 18.女,本科,讲师,月收入2800; 19.女,本科,副教授,月收入3900;20.女,本科,副教授,月收入3100; 21.男,本科,教授,月收入4200; 22.女,研究生,
3、教授,月收入3500; 23.女,研究生,讲师,月收入3200 24.女,研究生,讲师,月收入3900; 25.女,研究生,教授,月收入4800;26.女,研究生,讲师,月收入3100;,教学导例 某高校教师有关资料,27.男,本科,教授,月收入4500; 28.男,研究生,教授,月收入4700 29.男,研究生,教授,月收入4800;30.女,研究生,讲师,月收入3800 31.女,研究生,讲师,月收入3500;32.男,研究生,副教授,月收入3600 33.男,本科,副教授,月收入4200;34.女,本科,教授,月收入3900 35.男,研究生,讲师,月收入3200;36.女,本科,讲师,
4、月收入3200 37.女,本科,助教,月收入2100; 38.男,本科,副教授,月收入3600; 39.男,专科,讲师,月收入2600; 40.女,本科,教授,月收入4800; 41.女,本科,副教授,月收入3900;42.女,研究生,讲师,月收入3100; 43.男,本科,教授,月收入4500; 44.女,研究生,副教授,月收入3900 45.女,研究生,教授,月收入4200;46.女,专科,助教,月收入2900; 47.女,研究生,讲师,月收入2800;48.女,本科,教授,月收入4900; 49.男,本科,助教,月收入1800; 50.男,研究生,教授,月收入4600; 51.女,本科,
5、助教,月收入1900; 52.男,本科,副教授,月收入3800;,某高校教师有关资料(续1),53.男,专科,讲师,月收入2600; 54.女,本科,助教,月收入1800; 55.女,本科,助教,月收入1900; 56.女,本科,副教授,月收入3100; 57.男,本科,教授,月收入4200; 58.女,研究生,副教授,月收入3500 59.女,本科,讲师,月收入2800; 60.女,研究生,副教授,月收入3900 61.女,研究生,教授,月收入4100;62.女,研究生,助教,月收入1800 63.男,本科,助教,月收入1800; 64.男,研究生,助教,月收入1600 65.女,本科,助教
6、,月收入1900; 66.男,本科,副教授,月收入3700 67.男,专科,讲师,月收入2600; 68.女,本科,讲师,月收入2800; 69.女,本科,助教,月收入1600; 70.女,本科,副教授,月收入3100 71.男,本科,教授,月收入4200; 72.女,研究生,教授,月收入4500 73.女,本科,讲师,月收入2800; 74.女,研究生,副教授,月收入4200 75.女,研究生,助教,月收入2100; 76.女,研究生,助教,月收入1800 77.女,本科,助教,月收入1800; 78.女,本科,副教授,月收入3900 79.女,研究生,讲师,月收入3300 80.女,本科,
7、助教,月收入1800,某高校教师有关资料(续2),面对如此繁杂的 个体资料,大家 感觉怎么样?,那么整理为下面的图表又怎么样呢?,乱乱乱,整理结果的表现形式-统计图 该校教师职称及性别柱形图,该校教师职称、性别、学历结构图,整理结果的表现形式-统计表 该校教师职称及性别分布数列 单位:人,某高校教师月收入分布表,本项目的主要任务, 统计整理的意义和步骤 统计分组方法 次数分布(分配)数列 统计表的绘制,任务一 理解统计整理的概念地位 了解统计整理的基本步骤, 统计整理的地位 统计调查 统计整理 统计分析,一、统计整理的意义,搜集原始资料 对个体的感性认识,分类、汇总 过渡阶段,取得研究结论 对
8、总体的理性认识, 统计整理的概念 根据目的 对统计调查资料 实施分类、汇总 编制统计图表 为统计分析奠定基础,二、统计整理的步骤,制订整理方案,审核调查资料,具体实施整理,复查整理结果,编制统计图表,1,3,4,4,2,5,统计整理的步骤(续), 制订整理方案:主要内容有: 统计分组体系和统计指标体系; 编制整理表格和填表说明; 整理的组织形式和汇总的技术方法。 审核调查资料:审核内容包括: 调查资料的完整性和正确性。 审核方法:逻辑检查和计算检查。 绘制统计图表:统计资料表现形式(参见以下图表例),2010年全国不同规模的家庭户类别,“十五”时期我国进出口情况,任务二 理解统计分组的概念作用
9、 熟知统计分组的基本方法,一、统计分组的意义, 统计分组: 根据统计研究的需要,将总体 按一定的标志划分为若干性质 不同的组成部分的统计方法。, 两个涵义: 对总体而言是“分”, 对个体而言是“合”。,质量标准: 组内同质性 组间差异性,统计分组的主要作用,对社会经济现象进行类型划分 统计分组过程就是类型划分的过程。划分类型,揭示差异是统计分组的根本作用 。 对社会经济现象进行结构分析 反映总体内部结构,判定现象性质及变化。 研究社会经济现象间的依存关系 分析影响因素和结果之间的变动关系及规律。,二、统计分组的两个关键问题,(一)选择分组标志(首要问题),选择分组标志 的原则,根据研究目的,具
10、体问题具体分析,选择主要标志,(二)划分各组界限,在选定分组标志后,就需要明确组与组之间的界限。,如何正确选择分组标志?,选择主要标志:有时存在若干个标志 都能不同程度满足研究目的的需要。 如研究某高校职工生活水平,可用的 标志有:职工工资、收入、职工家庭月 人均收入、职工家庭年人均收入。 该选择哪个更为合适呢?,三、统计分组体系,简单分组:对总体只按一个标志分组。,平行分组体系:两个及以上标志分别分组,统计分组体系:运用多个分组标志对同 一总体进行分组形成的一系列相互联系、相互补充的统计分组的整体。,复合分组体系:两个及以上标志层叠分组,平行分组体系(人口分组为例),性别 男 女,年龄 0-
11、14 15-64 65以上,户籍 城 乡,平行分组体系适宜对研究对象进行 多角度、多方面分析。,复合分组体系(人口分组为例),城镇,农村,男,女,女,男,0-14 15-64 65以上,0-14 15-64 65以上,0-14 15-64 65以上,0-14 15-64 65以上,复合分组体系宜对研究对象 进行 多层次逐层深入分析,复合分组体系,注意:复合分组每增加一个层次就会使组数几何级增加。如上例: 2618组。因此复合分组层次也不可过多。有时候,为了排版和观感的需要复合分组的表现形式还可以采用上表式样。,2010年第六次人口普查分性别和年龄的人口复合分组情况,对问题的研究往往需要多角度和
12、多层次。平行分组体系可以满足多角度研究的需要,复合分组体系可以满足多层次研究的需要。,四、统计分组的种类及方法,统计分组,变量分组,品质分组,单项分组,组距分组,等距分组,异距分组,(一) 品质分组(实例),(二)变量分组,变量分组反映的是各组量的差别,通过量的差别来反映事物间的性质差别。,1.单项分组 每组只用一个具体的变量值来表示的分组。其组数由不重复的变量值个数决定;各组组值明确。适用于不重复的变量值个数不多的离散变量。,单项分组(实例),现有50名育龄妇女(15-49)生育子女数情况: 0 2 1 1 3 1 3 0 0 1 1 3 2 0 0 0 3 1 0 0 2 0 2 0 1
13、1 0 1 1 0 1 1 2 1 3 1 5 3 2 1 2 0 2 3 2 1 0 1 2 0,按育龄妇女生育子女数进行单项分组可分为: 0、1、2、3、5五组。,2、组距分组,各组用变量值的变动区间来表示。适用于连续变量和不重复的变量值个数很多的离散变量。 (1)几个基本概念: 组限:(下限、上限) 闭口组:下限、上限都有。如200300 开口组: 下开口组: 以下 上开口组: 以上,为什么要设开口组?,统计分组的原则:“不漏不重” 。即: (1)要使总体中的每个单位都有组可归,贯彻分 组的“穷举”原则;即:“不遗漏”原则。 (2)每个单位都只能归到某一组,不能重复归组; 即“互斥”原则
14、。 在出现极端值情况下,为了遵循统计分组的原则,应设置开口组解决极端值归组问题。,全距=最大值最小值 组距=上限下限 (注意:开口组组距以邻组组距代替)实例:,组距分组(续2),学生成绩分组 60以下 60-70 70-80 80-90 90以上,职工工资分组 1000以下 1000-2000 2000-3000 3000-4000 4000以上,年龄 0-14 15-64 65以上,下开口组 以下,上开口组 以上,上限,下限,组距,组中值,注 意 组中值代表组内各单位的一般水平。 其代表性受组内各单位分布是否均匀或是否在 组中值两侧成对称分布,否则计算出来的数值 与实际会有较大偏差。,(2)
15、组距分组要解决的几个主要问题 组距:等距分组或异距分组? 组距多长? 实际工作中,一般采用等距分组。 组数 :就是决定将总体分成多少组? 组距和组数必须先确定一个。当研究对象有明显的几个组成部分,则可先确定组数,再根据情况确定各组的组距。 组限:确定组限就是要找出何处是决定事物性质差别的数量界限?组限的表示方法?,组距和组数的关系 组数与组距的确定,要力求能够将总体分布的特点反映出来。由于全距是既定的,在等距分组情况下,组距和组数存在相互制约的关系:,需要注意:根据上式计算的只能是一个参考数。,若先确定组距 组距要适中。若组距过小,易将同质单位划分在不同组;若组距过大,会使不同性质的单位同处一
16、组,掩盖现象质的差异。 若先确定组距,应先观察原始资料,大致判断总体的水平高低和分布,然后确定组距。如对某公司职工按月收入分组。据资料若大致判断其收入普遍在3000元左右,此时以500元或1000元做为组距比较合适,若大致为1000元左右,则组距为100元或200元比较合适。,资料:现有某地区500个企业的计划完成 程度资 料,其中最低83%,最高125%,全距为42%。,据本资料可确定组数为6,则计算出的组距为7,分组结果为(1)。观察以下三种分组结果:,若先确定组数-实例讨论,先确定组数-实例讨论,分组结果(1) 83% -90% 90%-97% 97%-104% 104%-111% 11
17、1%-118% 118%-125%,分组结果(3) 80%-90% 90%-100% 100%-110% 110%-120% 120%-130%,分组结果(2) 83%-93% 93%-103% 103%-113% 113%-123% 123%-133%,以上哪种分组效果最好? 首先,分组(1)杂乱,难分析判断。一般等距分组时,组距尽可能取10或10的倍数,此例选10较合适。 其次,分组(1)第三组和分组(2)第二组均出现严重问题,既包括超额完成计划的,还包括没有完成计划的。 再次,组限问题,如确定组距为10,组数为5,而各组具体范围没搞清,分组(2)也不合适。 最后,在算全距时要注意别机械。
18、若有极端值,则以次大或次小值计算全距,再用开口组解决最大或最小值归组问题。 若此例有20%和180%,可以在计算全距时不考虑,组限的表示方法 组限的表示方式取决于变量的类型。连续变量,须采用重叠组限;离散变量可采用间断组限或重叠组限。如:企业按职工人数分组,不重叠组限 99以下 100 999 10004999 5000以上,重叠组限 100以下 1001000 10005000 5000以上,连续变量组限的表现方法-重叠组限,职工月收入分组 (元) 1500以下 1500-2000 2000-2500 2500-3000 3000-3500 3500-4000 4000以上,组距分组一般采用
19、等距分组; 各组组距以10或10的倍数为宜; 组数不可过多(少),10组以内5-10组为宜; 组限以10或10 的倍数为宜; 采用重叠组限,并遵循“上组限不在内”原则。 根据“穷举”原则要求,最小组的下限要不高于最小变量值; 最大组的上限要不低于最大变量值。,组距分组的一般处理方法,总结,任务三 了解分配数列的构成 熟知分配数列的编制,一、次数分布(分配)数列概念及构成,次数分布(分配)数列:是指在统计分组的基础上,将总体各单位进行归组整理编制而成的一种反映总体单位在各组之间分配状况的统计数列。,权 数,各组组别 单位数(频数、次数) 比重(频率),构成 要素,【课堂讨论1】,讨论目的:认识权
20、数的作用; 比较绝对数权数和相对数权数的作用差别 资料(1)现有甲乙两个班的某学期考试的成绩。,甲乙两班的英语学习成绩表,【课堂讨论2】,资料(2):现有A、B两个不同股份公司的甲、乙两股东所持本公司股份如下表。若甲、乙都是所在公司第一大股东。甲掌握本公司2000万股份,而乙只掌握本公司120万股份。 要求:判断甲、乙在本公司的决定权大小。,二、次数分布(分配)数列的种类,次数 分布,等距 数列,变量 数列,品质 数列,单项 数列,组距 数列,异距 数列,某校学生性别构成,某村农户按子女数分组,品质数列,次数,频率,变量数列,组别,组距数列的编制(实例),资料:现有2012年某地50户居民家庭
21、人均月收入资料如下: 822 794 773 737 898 827 798 776 746 811 855 740 775 796 867 824 882 729 764 788 735 771 791 819 860 726 762 786 809 852 1520 722 760 784 940 930 689 659 380 803 700 753 781 801 829 712 857 781 803 832 可以看出这些资料很凌乱,难以直接判断其分布特征。,组距数列的编制实例(续1),第一步:按顺序排列变量值;,第二步:计算全距; 变量值在380-1520之间,全距为1140。由于
22、 380和1520为极端值,计算全距可不予考虑。可用 开口组表示;则全距=940-659=281,第三步:确定组距或组数; 若分6组,则组距=281/6=46.8 ,组距设为 50;若分4组,则组距设为100。组距太小不能反映收入水平的差异,若先考虑组距,100更合适。,组距数列的编制实例(续2),某地50户居民家庭人均月收入表(1),组距数列的编制实例(续3),某地50户居民家庭人均月收入表(2),对以上两种组距数列进行比较可以看出:表(1)反映情况比较详细。,三、累计次数和累计频率,向下累计:将各组次数和频率由变量值大的组向变量值小的组逐项累计,各组累计数表明各组下限以上的累计次数和累计频
23、率。,向上累计:将各组次数和频率由变量值小 的组向变量值大的组逐项累计,各组累计 数表明各组上限以下的累计次数和累计频 率。,累计次数和累计频率(实例1),某班英语考试成绩表,累计频数和累计频率(实例2),累计频数和累计频率亦可用于品质数列,如:,累计频数和累计频率(实例3),某县农民家庭户按年人均纯收入累计次数和累计频率表,四、次数分布的主要类型,各种不同性质的现象有着各自特殊的次数分布。概括起来主要有三种:钟形(正态与偏态)、 U形和J形(正J与反J)分布。如下图:,五、统计汇总,统计汇总:是在统计分组基础上,根据整理方案所确定的指标体系的要求,计算各项指标分组数值和总计数值,以获得综合统
24、计资料的工作过程。 统计汇总组织形式:逐级汇总和集中汇总 统计汇总技术方法:手工汇总 计算机汇总,任务四 了解统计表作用及分类 熟知统计表的制表规则,引例:某机械制造厂职工资料分组汇总如下: 初级工:240人,其中男80人,女160人,在男职工中,工龄在5年以下的30人,在5-10年的40人,10年以上的10人,在女职工中,工龄在5年以下的90人,在5-10年的40人,10年以上的30人; 中级工:420人,其中男380人,女40人,在男职工中,工龄在5年以下的150人,在5-10年的200人,10年以上的30人,在女职工中,工龄在5年以下的10人,在5-10年的25人,10年以上的5人;高级
25、工:360人,其中男250人,女110人,在男职工中,工龄在5年以下的50人,在5-10年的70人, 10年以上的130人,在女职工中,工龄在5年以下的70人,在5-10年的30人,10年以上的10人。,思考:该种表现形式好吗?,某机械制造厂职工分布情况表-统计表表现整理结果 单位:人,这种表现形式如何?,一、统计表的作用,统计表:是用表格来系统显示统计资料的一种基本形式。统计表是重要和有效的统计资料表现形式。 广义的统计表包括统计工作各个阶段的一切表格,包括调查表、整理表和分析表。统计整理表是表明前述资料整理的结果,又是后续资料分析工作的开始。 统计表的作用:通过对统计资料有条理地组织与安排
26、,统计表使枯燥杂乱的统计数字资料系统清晰,直观易懂,鲜明、形象和生动,一目了然。统计表内的数字组织科学,排列有序,便于阅读和对照比较。统计表还是分析研究各指标之间的数量关系,进行统计分析的有效工具。,二、统计表的构成,从统计表的表式结构看,统计表包括: 总标题、横行标题、纵栏标题和数字资料四个部分。,从统计表的内容看,统计表由主词和宾词 两部分组成。,2012年我国三次产业产值构成表,总标题,纵栏 标题,横 行 标 题,数 字 资 料,主 词,宾 词,三、统计表的分类,统计表,分析表,对主词的 分组情况,按性质,整理表,调查表,按作用,空间数列表,时间数列表,复合分组表,简单分组表,平行分组表
27、,简单表,分组表,时空数列结合表,2011年末我国三次产业就业构成表(简单分组表),资料来源:2011年度人力资源和社会保障事业发展统计公报,2012年我国人口数及其构成(平行分组表),2012年某地人口城乡及性别分布表(复合分组表),统计表-时空数列结合表,河南与全国人口老龄化进程表 单位:%,(资料来源:第六次人口普查统计公报,河南为常驻人口资料),四、统计表的设计-宾词的配置,在设计统计表时,除对主词是否分组外,对宾词也要根据分析问题的祥略要求,进行合理配置。 宾词配置的三种形式: 简单配置、平行配置、复合配置,2012年四通和百利公司职工性别分布表 单位:人,统计表宾词的配置-简单配置,简单配置:在对宾词指标不再要求细分的情况下,将各项指标按主次 顺序作简单排列。,宾词平行配置是对宾词指标进行几种简单分组以后在表中平行编排。如:,某地两企业工人的性别和工龄分布表 单位:人,统计表宾词的配置 -平行配置,宾词复合配置:对宾词指标复合分组以后在表中层叠配置。如下表:,某地两企业工人的工龄和性别分布表 单位:人,统计表宾词的配置 -复合配置,统计表的设计规则,一般原则:科学、实用、简明、美观。 注意事项: 1、标题简明 2、左右开口 3、线条清晰 4、基线加粗 5、标明单位 6、数字照齐 7、排列有序 8、编写序号 9、布局合理 10、表外注释,统计整理知识结构图,
链接地址:https://www.31doc.com/p-3218410.html