统计学数据分布特征的描述.ppt
《统计学数据分布特征的描述.ppt》由会员分享,可在线阅读,更多相关《统计学数据分布特征的描述.ppt(45页珍藏版)》请在三一文库上搜索。
1、Page 1,第三章 数据分布特征的描述,通过调查获得、经过整理后展现的数据已经可以反映出被研究对象的一些状态与特征,但认知程度还比较肤浅,反映的精确度不够,为此,我们要使用各类代表性的数量特征值来准确地描述这些数据。,Page 2,对单变量截面数据的特征描述,主要有四个方面:集中趋势、离散程度、偏态与峰度。,各类代表性的数量特征值,代表值是多少,代表性有多大,代表性可靠吗,集中趋势的度量,离散趋势的度量,分布特征的度量,平均指标,变异指标,偏度峰度指标,基本公式,简单式,加权式,算术平均数,调和平均数,几何平均数,中位数,众数,极差,平均差,标准差,离散系数,原点矩,中心距,N阶矩,第三章
2、数据分布特征的描述,Page 3,第三章 数据分布特征的描述,第一节 统计变量集中趋势的测定,第二节 统计变量离散程度的测定,第三节 变量分布的偏度与峰度,第四节 利用Excel计算描述统计指标,Page 4,第一节 统计变量集中趋势的测定,一 测定集中趋势的指标及其作用,二 数值平均数,三 众数与中位数,Page 5,一、测定集中趋势的指标及其作用,集中趋势(Central tendency) 较大和较小的观测值出现的频率比较低,大多数观测值密集分布在中心附近,使得全部数据呈现出向中心聚集或靠拢的态势。 测度集中趋势的指标有两大类: 数值平均数是根据全部数据计算得到的代表值,主要有算术平均数
3、、调和平均数及几何平均数; 位置代表值根据数据所处位置直接观察或根据与特定位置有关的部分数据来确定的代表值,主要有众数和中位数。,Page 6,测定集中趋势指标的作用,1反映变量分布的集中趋势和一般水平。 如用平均工资了解职工工资分布的中心,反映职工工资的一般水平。 2可用来比较同一现象在不同空间或不同阶段的发展水平。 不受总体规模大小的影响; 在一定程度上使偶然因素的影响相互抵消。 3可用来分析现象之间的依存关系。 如研究劳动者的文化程度与收入的关系。 4平均指标也是统计推断中的一个重要统计量,是进行统计推断的基础。,Page 7,二、数值平均数,(一)算术平均数(均值) 一组数据的总和除以
4、这组数据的项数所得的结果; 最常用的数值平均数。 1简单算术平均数 把每项数据直接加总后除以它们的项数。 通常用于对未分组的数据计算算术平均数。 计算公式:,Page 8,二、数值平均数,2加权算术平均数加权算术平均数的计算公式:,加权为了体现各变量值轻重不同的影响作用,对各个变量值赋予不尽相同的权数(fi )。,Page 9,二、数值平均数,2加权算术平均数 加权算术平均数的计算公式: 权数(fi ,也称权重) 权数指在计算总体平均数或综合水平的过程中对各个数据起着权衡轻重作用的变量。可以是绝对数形式,也可以是比重形式(如频率)来表示。 事实上比重权数更能够直接表明权数的权衡轻重作用的实质。
5、,Page 10,二、数值平均数,2加权算术平均数权数的性质:,加权为了体现各变量值轻重不同的影响作用,对各个变量值赋予不尽相同的权数(fi ),表 1,表 2,表 3,大变量值组大权数,小变量值组小权数,则平均数就大 大变量值组小权数,小变量值组大权数,则平均数就小,当权数完全相等(f1 =f2 = fn)时,加权算术平均数就成了简单算术平均数。,Page 11,3由组距数列计算算术平均数 各组变量值用组中值来代表。 假定条件是各组内数据呈均匀分布或对称分布。 计算结果是近似值。,二、数值平均数,Page 12,4对相对数求算术平均数 由于各个相对数的对比基础不同,采用简单算术平均通常不合理
6、,需要加权。,权数的选择必须符合该相对数本身的计算公式。 权数通常为该相对数的分母指标。,二、数值平均数,Page 13,5算术平均数的主要数学性质 (1)算术平均数与变量值个数的乘积等于各个变量值的总和 (2)各变量值与算术平均数的离差之总和等于零 (3)各变量值与算术平均数离差平方之总和为最小,二、数值平均数,Page 14,二、数值平均数,(二)调和平均数(Harmonic mean),对于已分组资料,当已知各组单位总量f,未知各组标志总量m时,采用加权算术平均数。,表 1,表 2,商务统计中所应用的调和平均数通常是加权算术平均数的变形,对于已分组资料,当已知各组标志总量m,未知各组单位
7、总量f时,采用加权调和平均数。,对于未分组资料,或虽已分组但各组次数相同时,采用简单算术平均数。,Page 15,二、数值平均数,(二)调和平均数(Harmonic mean) 调和平均数也称为倒数平均数。各变量值的倒数(1/xi)的算术平均数的倒数。其计算公式为:,对于未分组资料,采用简单调和平均数。,对于已分组资料,当已知各组标志总量m,未知各组单位总量f时,采用加权调和平均数。,Page 16,二、数值平均数,【例】某企业产品的加工要顺次经过前后衔接的五道工序。本月该企业各加工工序的合格率分别为88、85、90、92、96,试求这五道工序的平均合格率。 本例中各工序的合格率具有环比的性质
8、,企业产品的总合格率等于各工序合格率之连乘积。所以,所求的平均合格率应为:,(三)几何平均数(Geometric mean),Page 17,(三)几何平均数(Geometric mean) 几何平均数 n个变量值连乘积的n次方根。 简单几何平均数 加权几何平均数 适用于各个变量值之间存在连乘积关系的场合。 主要用于计算现象的平均发展速度; 也适用于对某些具有环比性质的比率求平均。,二、数值平均数,Page 18,数值平均数小结:,二、数值平均数,简单式,加权式,算术 平均数,调和 平均数,几何 平均数,算术和的关系,倒数和的关系,连乘积的关系,由未分组资料计算,由已分组资料计算,变量值的关系
9、,数值平均数的计算,Page 19,三、众数与中位数,(一)众数(Mode) 众数是一组数据中出现频数最多、频率最高的变量值,常用 Mo 表示。 如表3-2中年龄的众数值Mo25。 众数代表的是最常见、最普遍的状况,是对现象集中趋势的度量。 可用来测度定性变量的集中趋势; 销售量最大的产品颜色是“白色”,则有Mo“白色”。 可以度量定量变量的集中趋势。 从分布曲线的角度看,众数就是变量分布曲线的最高峰所对应的变量值。,Page 20,组距数列中众数的确定,先找到众数组。 在等距数列中,众数组就是次数最多的组; 在异距数列中,众数组应是频数密度最大的组。 根据众数组与其相邻两组的次数差来推算。
10、其近似公式为:,下限公式:,上限公式:,Page 21,第二节 统计变量离散程度的测定,测度集中趋势的指标有两大类: 数值平均数主要有算术平均数、调和平均数及几何平均数; 位置代表值主要有众数和中位数。 测度离中趋势的指标也有两大类: 数值平均数的代表性主要有极差、平均差、方差和标准差、离散系数; 位置代表值的代表性主要有四分位差、异众比例。,Page 22,第二节 统计变量离散程度的测定,一 测定离散程度的指标及其作用,二 极差、四分位差和平均差,三 方差和标准差,四 离散系数,五 异众比率,Page 23,一、测定离散程度的指标及其作用,1.说明数据的分散程度,反映变量的稳定性、均衡性。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 统计学 数据 分布 特征 描述
链接地址:https://www.31doc.com/p-2122776.html