欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 研究报告>
  • 工作总结>
  • 合同范本>
  • 心得体会>
  • 工作报告>
  • 党团相关>
  • 幼儿/小学教育>
  • 高等教育>
  • 经济/贸易/财会>
  • 建筑/环境>
  • 金融/证券>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > PPT文档下载
     

    第一部分分布的集中趋势第二部分分布的离散程度.ppt

    • 资源ID:3113300       资源大小:867.52KB        全文页数:98页
    • 资源格式: PPT        下载积分:8
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录   微博登录  
    二维码
    微信扫一扫登录
    下载资源需要8
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第一部分分布的集中趋势第二部分分布的离散程度.ppt

    第一节 分布的集中趋势 第二节 分布的离散程度 第三章 统计分布的数值特征 本章主要内容 本章包括平均指标和变异指标两部分内本章包括平均指标和变异指标两部分内 容,阐述了平均指标的概念和作用;各种平均容,阐述了平均指标的概念和作用;各种平均 数的计算原则、方法与应用条件;主要的平均数的计算原则、方法与应用条件;主要的平均 指标指标( (算术平均数、调和平均数、几何平均数算术平均数、调和平均数、几何平均数 、众数和中位数、众数和中位数) );变异指标的作用、计算方;变异指标的作用、计算方 法和运用条件;主要的变异指标法和运用条件;主要的变异指标( (极差、平均极差、平均 差、标准差及其系数差、标准差及其系数) )。 第一节第一节 分布的集中趋势分布的集中趋势 vv一、统计平均数的概述一、统计平均数的概述 vv二、数值平均数二、数值平均数 vv三、位置平均数三、位置平均数 vv四、各种平均数比较四、各种平均数比较 一、统计平均数的概述 (一)平均数的概念(一)平均数的概念 同类社会经济现象总体内,各单位某一数 量标志的差异抽象化,用以反映总体在具 体条件下的一般水平。 它是度量总体某一数量标志在一定条件下的一 般水平或分布集中趋势的综合指标。 一名统计学家遇到一位数学家,统计学家调 侃数学家说道:“你们不是说若且 ,则吗!那么想必你若是喜欢一个女 孩,那么那个女孩喜欢的男孩你也会喜欢喽! ?” 数学家想了一下反问道:“那么你把左手放 到一锅一百度的开水中,右手放到一锅零度的 冰水里想来也没事吧!因为它们平均的温度不 过是五十度而已!” 统计学家与数学家 如果你的腳已經踩在爐 子上,而頭卻在冰箱裡,統 計學家會告訴你,平均而言 ,你相當舒服。 调侃统计学家 (二)平均数的种类(二)平均数的种类 根据各种平均数的具体代表意义和计算方根据各种平均数的具体代表意义和计算方 式的不同,统计平均数分为两大类:式的不同,统计平均数分为两大类: 算术平均数算术平均数 调和平均数调和平均数 数值平均数数值平均数 几何平均数几何平均数 众数众数 中位数中位数 位置平均数位置平均数 分位数分位数 (三)平均数的特点(三)平均数的特点 vv1.1.将数量差异抽象化将数量差异抽象化 vv2.2.只能就同类现象计算只能就同类现象计算 vv3.3.能反映总体变量值的集中趋势能反映总体变量值的集中趋势 二、数值平均数二、数值平均数 (一)概述(一)概述 1.1.定义定义 数值平均数是由统计数据集合中的所有数据参与数值平均数是由统计数据集合中的所有数据参与 计算所得的平均数。计算所得的平均数。 2.2.常用的数值平均数有:常用的数值平均数有: 算术平均数、调和平均数和几何平均数算术平均数、调和平均数和几何平均数 (二)算术平均数(二)算术平均数 1.1.概念概念 算术平均数是全部数据的算术平均数是全部数据的算术算术平均。平均。 基本公式:基本公式: e.g.e.g. 2.2.算术平均数的计算方法算术平均数的计算方法 (1)(1)简单算术平均数简单算术平均数 如果掌握的资料没有经过分组,则先将各单位如果掌握的资料没有经过分组,则先将各单位 的标志值相加得出标志总量,然后再除以总体的标志值相加得出标志总量,然后再除以总体 单位数,得到的平均数称为简单算术平均数。单位数,得到的平均数称为简单算术平均数。 简单算术平均数的计算公式:简单算术平均数的计算公式: 例例3131某机械厂某生产班组有某机械厂某生产班组有1010名工人,生产某名工人,生产某 种零件,每个工人的日产量分别为种零件,每个工人的日产量分别为4545件,件,4848件,件,5252件件 ,6262件,件,6969件,件,4444件,件,5252件,件,5858件,件,3838件,件,6464件。试件。试 用简单算术平均数法计算工人平均日产量用简单算术平均数法计算工人平均日产量。 (2)(2)加权算术平均数加权算术平均数 如果掌握的资料是经过分组整理编成了分布数如果掌握的资料是经过分组整理编成了分布数 列,并且每组频数不同时,列,并且每组频数不同时,用频数(率)进行用频数(率)进行 加权加权计算的算术平均数称为加权算术平均数。计算的算术平均数称为加权算术平均数。 a.a.加权算术平均数计算加权算术平均数计算 公式公式1 1: vv例:某机械厂工人例:某机械厂工人 日产零件数的分配数列。日产零件数的分配数列。 权数权数 加权加权 公式: 单项式数列的算术平均数单项式数列的算术平均数 组距式加权算术平均数组距式加权算术平均数 例:某年我国80个产棉 大县的分配数列如表。 以组中值作为各组的代表值以组中值作为各组的代表值, 假定假定各组标志值在组内分布各组标志值在组内分布 是均匀的。是均匀的。此时求得的算此时求得的算 术平均数只是其真值的术平均数只是其真值的 近似值。近似值。 公式2 例例 3 33 3某企业工人操作机床的情况见下表,某企业工人操作机床的情况见下表, 计算平均每位工人操作机床数。计算平均每位工人操作机床数。 注意比重转化为小数再计算 b.b.权数及作用权数及作用 vv权数:加权算术平均数中的权数,是标志值权数:加权算术平均数中的权数,是标志值 出现的频数(次数)出现的频数(次数) f f 或各组次数占总次数的或各组次数占总次数的 比重(频率)比重(频率) 。 vv权数的作用:权衡平均数大小。权数的作用:权衡平均数大小。 vv某一组的次数或频率越大,则该组的标志值某一组的次数或频率越大,则该组的标志值 对平均数的影响就越大,反之越对平均数的影响就越大,反之越小。小。 c.c.影响加权算术平均数大小的因素影响加权算术平均数大小的因素 加权算术平均数的大小受两个因素影响加权算术平均数的大小受两个因素影响 受受单位标志值单位标志值大小的影响。大小的影响。 受各标志值受各标志值频数频数的影响,更准确的讲的影响,更准确的讲 是受各组频数占总频数比重即是受各组频数占总频数比重即频率频率的影响的影响 。 d.d.加权算术平均数适用加权算术平均数适用 vv分组的统计资料,如果已知各组的分组的统计资料,如果已知各组的 代表变量值和频数(频率),则可采代表变量值和频数(频率),则可采 用加权算术平均数计算。用加权算术平均数计算。 vv已知频数用公式已知频数用公式1 1。 vv已知频率用公式已知频率用公式2 2。 e.e.简单与加权算术平均数相等的条件简单与加权算术平均数相等的条件 vv在在分组分组的条件下,的条件下,当各组频数所占比重当各组频数所占比重 均相等时,均相等时,权数就失去了权衡轻重的作用权数就失去了权衡轻重的作用 ,这时用加权算术平均数计算的结果与用,这时用加权算术平均数计算的结果与用 简单算术平均数计算的结果相同。简单算术平均数计算的结果相同。 vv当分布数列完全对称时,当分布数列完全对称时,加权算术平均加权算术平均 数的计算结果与简单算术平均数计算结果数的计算结果与简单算术平均数计算结果 相同。相同。 3.3.算术平均数的数学性质算术平均数的数学性质 vv各个变量值与算术平均数的离差总和等于零。各个变量值与算术平均数的离差总和等于零。 vv各个变量值与算术平均数的离差平方总和为最各个变量值与算术平均数的离差平方总和为最 小值。小值。 vv两个独立的同性质变量代数和的平均数等于各两个独立的同性质变量代数和的平均数等于各 变量平均数的代数和。变量平均数的代数和。 vv两个独立的同性质变量乘积的平均数等于各变两个独立的同性质变量乘积的平均数等于各变 量平均数的乘积。量平均数的乘积。 1.1.概念概念 调和平均数是变量值调和平均数是变量值倒数倒数的算的算 术平均数的术平均数的倒数倒数,故又称倒数,故又称倒数 平均数。平均数。 调和平均数是算术平均数的一调和平均数是算术平均数的一 种,它是根据变量值的倒数计种,它是根据变量值的倒数计 算的。算的。 (二)调和平均数(二)调和平均数 原来只是计算原来只是计算 时使用了不同时使用了不同 的数据!的数据! (1 1)简单调和平均数)简单调和平均数 2.2.调和平均数的计算调和平均数的计算 (2 2)加权调和平均数)加权调和平均数 例:某工厂工人日产零件数资料例:某工厂工人日产零件数资料 作为算术平均数的变形使作为算术平均数的变形使 用。用。 已知分配数列各组已知分配数列各组标志值标志值及及 其其标志总量标志总量时,计算平均数时,计算平均数 可用加权调和平均法,可用加权调和平均法,权数权数 mm为各组的标志总量为各组的标志总量。 即即: 3. 3.应用场合应用场合 4.4.调和平均数的特点调和平均数的特点 vv如果数列中有一个标志值等于如果数列中有一个标志值等于零零,则无法计,则无法计 算调和平均数。算调和平均数。 vv它作为一种数值平均数受所有标志值的影它作为一种数值平均数受所有标志值的影 响,且受极小值的影响大于受极大值的影响响,且受极小值的影响大于受极大值的影响 ,但较之算术平均数,调和平均数受极端值的,但较之算术平均数,调和平均数受极端值的 影响较小。影响较小。 说明:说明: 算术平均数和调和平均数不仅可以用于计算术平均数和调和平均数不仅可以用于计 算严格意义上的单位标志平均数,而且还算严格意义上的单位标志平均数,而且还 可以用于计算平均指标和相对指标的平均可以用于计算平均指标和相对指标的平均 数,算的时候并不要求符合平均数的基本数,算的时候并不要求符合平均数的基本 公式。公式。 下面仅举例子说明! 1.1.由平均数计算平均数由平均数计算平均数 e.g.e.g.已知某商品在三个已知某商品在三个 集贸市场上的平均价集贸市场上的平均价 格及销售量资料如格及销售量资料如 右表:右表: 求三个市场的平均价求三个市场的平均价 格。格。 市市场场场场 平均价格平均价格 x x 销销销销售量售量 f f 销销销销售售额额额额 mm 甲甲2.003000060000 乙乙2.502000050000 丙丙2.402500060000 合合计计计计75000170000 2.2.由相对数计算平均数由相对数计算平均数 e.g.e.g.某工业公司有三个某工业公司有三个 工厂,已知其计划完工厂,已知其计划完 成程度()以及计成程度()以及计 划产值资料如划产值资料如 右表:右表: 求该公司平均计划完求该公司平均计划完 成程度。成程度。 工厂工厂 计计计计划完成划完成 程度()程度() x x 计计计计划划产值产值产值产值 f f 实际产值实际产值实际产值实际产值 mm 甲甲9512001140 乙乙1051280013440 丙丙11520002300 合合计计计计1600016880 计算相对指标(或平均指标)的平均数的计算相对指标(或平均指标)的平均数的 一般方法可以概括如下:一般方法可以概括如下: (1)(1)若已知的是相对指标(或平均指标)若已知的是相对指标(或平均指标) 的分母资料时,可将其作为权数,采用加的分母资料时,可将其作为权数,采用加 权算术平均法计算;权算术平均法计算; (2)(2)若已知的是相对指标(或平均指标)若已知的是相对指标(或平均指标) 的分子资料时,可将其作为权数,采用加的分子资料时,可将其作为权数,采用加 权调和平均数法计算。权调和平均数法计算。 小小 结结 某日三种蔬菜的某日三种蔬菜的销销销销售数据售数据 蔬菜蔬菜 名称名称 平均价格平均价格( (元元/kg)/kg) x x i i 销销销销售售额额额额( (元元) ) mm i i 销销销销售量售量( (公斤公斤) ) x x i i /m /m i i 甲 乙 丙 1.20 0.50 0.80 18000 12500 6400 15000 25000 8000 合计计3690048000 1. 1.某蔬菜市场三种蔬菜的日销售数据如表,计算三种蔬菜某蔬菜市场三种蔬菜的日销售数据如表,计算三种蔬菜 该日的平均价格。该日的平均价格。 例题 某公司下属三个部门销售情况某公司下属三个部门销售情况 部 部 门门门门 销销销销售利售利润润润润率(率(% ) 销销销销售售额额额额(万元)(万元) x x f f A A B B C C 1212 1010 7 7 10001000 20002000 15001500 合 合 计计计计45004500 2.2.设某公司下属三个部门的销售资料如下表,求公司设某公司下属三个部门的销售资料如下表,求公司 的平均销售利润率。的平均销售利润率。 vv三个部门的平均利润率即是公司的销售利润三个部门的平均利润率即是公司的销售利润 率。所以可用各部门的利润率乘以销售额得到率。所以可用各部门的利润率乘以销售额得到 各部门的利润额,然后用各部门利润总额除以各部门的利润额,然后用各部门利润总额除以 总销售额便可得到平均利润率。其计算公式为总销售额便可得到平均利润率。其计算公式为 : 如果上例若缺少销售额资料而有利润额资料,如果上例若缺少销售额资料而有利润额资料, 如下表如下表 某公司下属三个部门销售情况某公司下属三个部门销售情况 部 部 门门门门 销销销销售利售利润润润润率(率(% ) 利利润额润额润额润额 (万元)(万元) x x mm A A B B C C 1212 1010 7 7 120120 200200 105105 合 合 计计计计425425 则三个部门的平均利润率可以用各部门利润则三个部门的平均利润率可以用各部门利润 额除以销售利润率得到销售额,然后用各部额除以销售利润率得到销售额,然后用各部 门利润之和除以总销售额,便可得到平均利门利润之和除以总销售额,便可得到平均利 润率。其计算公式:润率。其计算公式: 3. 3.某管理局所属某管理局所属1515个企业销售计划完成情况资料如下表:个企业销售计划完成情况资料如下表: 权数的正确选择很重要 【例例3 34 4】水果甲级每元水果甲级每元1 1公斤,乙级每元公斤,乙级每元1.51.5公斤,丙级公斤,丙级 每元每元2 2公斤。问:公斤。问: (1 1)若各买)若各买1 1公斤,平均每元可买多少公斤?公斤,平均每元可买多少公斤? (2 2)各买)各买6.56.5公斤,平均每元可买多少公斤?公斤,平均每元可买多少公斤? (3 3)甲级)甲级3 3公斤,乙级公斤,乙级2 2公斤,丙级公斤,丙级1 1公斤,平均每元可公斤,平均每元可 买多少公斤?买多少公斤? (4 4)甲乙丙三级各买)甲乙丙三级各买1 1元,每元可买几公斤?元,每元可买几公斤? 【例例3 35 5】自行车赛时速:甲自行车赛时速:甲3030公里公里/ /小时,乙小时,乙2828公里公里/ / 小时,丙小时,丙2020公里公里/ /小时,全程小时,全程200200公里,问三人平均时速公里,问三人平均时速 是多少?若甲乙丙三人各骑车是多少?若甲乙丙三人各骑车2 2小时,平均时速是多少小时,平均时速是多少 ? 调和平均数 (例题分析) 【例例3 34 4】解解 (1) (2) (3) (4) 【例例3 35 5】解解 1.1.概念概念 几何平均数又称为对数平均数,它是几何平均数又称为对数平均数,它是n n个变个变 量值连乘积的量值连乘积的n n次算术根。次算术根。 2.2.适用范围适用范围 它是计算平均比率和平均速度时比较适用的它是计算平均比率和平均速度时比较适用的 一种方法。一种方法。 (三)几何平均数 3.3.几何平均数的计算方法几何平均数的计算方法 (1)(1)简单几何平均数简单几何平均数 【例3-6】谋生产车间生产某产品合格率分谋生产车间生产某产品合格率分 别为:别为:9797、9393、9191和和8787,则该车间,则该车间 制品平均合格率为:制品平均合格率为: (2)(2)加权几何平均数加权几何平均数 【例3-7】投资银行某笔投资是按复利计算的,投资银行某笔投资是按复利计算的,2525年间年间 年利率的分配情况是:有年利率的分配情况是:有1 1年为年为3 3,有,有4 4年为年为5 5,有,有 8 8年为年为8 8,有,有1010年为年为1010,有,有2 2年为年为1515。求平均年。求平均年 利率。利率。 计算平均年利率,必须先将各年的利率加上计算平均年利率,必须先将各年的利率加上100100,换,换 算为各年的本利率;然后按加权几何平均数的方法,算为各年的本利率;然后按加权几何平均数的方法, 计算平均年本利率;再减去计算平均年本利率;再减去100100,得出平均年利率。得出平均年利率。 计算如下:计算如下: 这就是说,这就是说,2525年间年平均本利率为年间年平均本利率为108.6108.6。因而,年。因而,年 平均利率为平均利率为8.68.6。 (四)几何平均数、算术平均数(四)几何平均数、算术平均数 和调和平均数的关系和调和平均数的关系 vv几何平均数、算术平均数和调和平均数之间存几何平均数、算术平均数和调和平均数之间存 在着一定的数量关系。这种数量关系表现在:在着一定的数量关系。这种数量关系表现在: 根据同一资料根据同一资料所计算的三种平均数,几何平均所计算的三种平均数,几何平均 数大于调和平均数而小于算术平均数,只有当数大于调和平均数而小于算术平均数,只有当 所有变量值都相同时,三种平均数才相等。用所有变量值都相同时,三种平均数才相等。用 数学公式表示,它们之间的关系为:数学公式表示,它们之间的关系为: 三、位置平均数三、位置平均数 (一)概述(一)概述 1.1.概念概念 位置平均数是根据总体中处于特殊位置上的位置平均数是根据总体中处于特殊位置上的个个 别单位或部分单位别单位或部分单位的标志值来确定的代表值。的标志值来确定的代表值。 2.2.常用的位置平均数常用的位置平均数 众数、中位数众数、中位数 (二)众数(二)众数 1.1.概念概念 总体中出现次数最多的变量值称为众数。总体中出现次数最多的变量值称为众数。 2.2.特点特点 uu适于数据较多时使用,主要用于定类数据;适于数据较多时使用,主要用于定类数据; uu不受极端值和开口组数列的影响;不受极端值和开口组数列的影响; uu众数是一个不容易确定的平均指标,当数列众数是一个不容易确定的平均指标,当数列 没有明显的集中趋势而趋向集中均匀分布时,则没有明显的集中趋势而趋向集中均匀分布时,则 无众数可言;当变量数列是异距分组时,众数的无众数可言;当变量数列是异距分组时,众数的 位置也不好确定。位置也不好确定。 众数众数( (不惟一性不惟一性) ) 无众数无众数 原始数据原始数据: 10 5 9 12 6 8: 10 5 9 12 6 8 一个众数一个众数 原始数据原始数据: 6 : 6 5 5 9 8 9 8 5 55 5 多于一个众数多于一个众数 原始数据原始数据: 25 : 25 28 28 2828 36 36 42 42 4242 (1 1)定类数据的众数)定类数据的众数 不同品牌不同品牌饮饮饮饮料的料的频频频频数分布数分布 饮饮料品牌频频数比例 百分比 (%) 可口可乐乐 旭日升冰茶 百事可乐乐 汇汇源果汁 露露 15 11 9 6 9 0.30 0.22 0.18 0.12 0.18 30 22 18 12 18 合计计501100 解:解:这里的变量为这里的变量为“ “饮饮 料品牌料品牌” ”,这是个分类,这是个分类 变量,不同类型的饮料变量,不同类型的饮料 就是变量值就是变量值 所调查的所调查的5050人中,购人中,购 买可口可乐的人数最多买可口可乐的人数最多 ,为,为1515人,占总被调查人,占总被调查 人数的人数的30%30%,因此众数,因此众数 为为“ “可口可乐可口可乐” ”这一品牌这一品牌 ,即,即 MM o o 可口可乐可口可乐 3.3.计算计算 (2 2)定序数据的众数)定序数据的众数 解:解:这里的数据为顺这里的数据为顺 序数据。变量为序数据。变量为“ “回回 答类别答类别” ” 甲城市中对住房甲城市中对住房 表示不满意的户数最表示不满意的户数最 多,为多,为108108户,因此户,因此 众数为众数为“ “不满意不满意” ”这一这一 类别,即类别,即 MM o o 不满意不满意 甲城市家庭甲城市家庭对对对对住房状况住房状况评评评评价的价的频频频频数分布数分布 回答类别类别 甲城市 户户数 (户户)百分比 (%) 非常不满满意 不满满意 一般 满满意 非常满满意 24 108 93 45 30 8 36 31 15 10 合计计300100.0 (3 3)数值型数据的众)数值型数据的众数数 下限公式下限公式: : 上限公式上限公式: : 某年级83名女生身高资料 身高 人数 (CM) (人) 152 1 154 2 155 2 156 4 157 1 158 2 159 2 160 12 161 7 162 8 163 4 身高 人数 (CM) (人) 164 3 165 8 166 5 167 3 168 7 169 1 170 5 171 2 172 3 174 1 总计 83 身高 人数 比重 (CM) (人) (%) 150-155 3 3.61 155-160 11 13.25 160-165 34 40.96 165-170 24 28.92 170以上 11 13.25 总计 83 100 某年级83名女生身高资料 (三)中位数(三)中位数 1.1.概念概念 中位数是将总体各单位标志值按大小顺序排列中位数是将总体各单位标志值按大小顺序排列 后,处于中间位置的那个数值。后,处于中间位置的那个数值。 2.2.意义意义 中位数是处于统计数列中间位置的数值。由于中位数是处于统计数列中间位置的数值。由于 其位置居中,不受其位置居中,不受极端数值极端数值大小的影响,因而大小的影响,因而 有时直接利用它来代表现象的有时直接利用它来代表现象的一般水平一般水平。 3.中位数的特点 (1 1)与众数一样,也是一种位置平均数,不受)与众数一样,也是一种位置平均数,不受 极端值及开口组的影响,具有稳健性;极端值及开口组的影响,具有稳健性; (2 2)各单位标志值与中位数离差的绝对值之和)各单位标志值与中位数离差的绝对值之和 为最小。即为最小。即 (3 3)对某些不具有数学特点或不能用数字测定)对某些不具有数学特点或不能用数字测定 的现象,可用中位数求其一般水平。的现象,可用中位数求其一般水平。 (1 1)由未分组资料确定中位数)由未分组资料确定中位数 vv在资料未经分组时,确定中位数的方法是:在资料未经分组时,确定中位数的方法是:首先将首先将 各总体单位的标志值或变量值,按照各总体单位的标志值或变量值,按照大小顺序排列大小顺序排列; 然后确定中位数的位置,处于中位数位置的标志值或然后确定中位数的位置,处于中位数位置的标志值或 变量值就是中位数。变量值就是中位数。 v由未分组资料确定中位数,中位数的位置是: v 如果总体单位的项数(如果总体单位的项数(n n)是是奇数奇数,则处于中间位,则处于中间位 置的标志值就是中位数。如果总体单位的项数是置的标志值就是中位数。如果总体单位的项数是偶数偶数 ,则处于中间位置的两个标志值的算术平均数就是中,则处于中间位置的两个标志值的算术平均数就是中 位数。位数。 4.4.计算计算 vve.g1e.g1,某年我国饮料制造业按利税总额排序,前某年我国饮料制造业按利税总额排序,前1010名名 企业的利税总额资料如下,企业的利税总额资料如下, vv根据上列资料,如果确定这根据上列资料,如果确定这1010名企业利税总额名企业利税总额 的中位数,则:的中位数,则: vv就是说,中位数处于第就是说,中位数处于第5 5个企业和第个企业和第6 6个企业的个企业的 中间位置。第中间位置。第5 5个企业的利税总额为个企业的利税总额为6666百万元,百万元, 第第6 6个企业的利税总额为个企业的利税总额为6565百万元,故百万元,故1010名企业名企业 利税总额的中位数为:利税总额的中位数为: ne.g2,9个家庭的人均月收入数据 n n 原始数据原始数据: : 1500 750 780 1080 850 960 2000 1500 750 780 1080 850 960 2000 1250 16301250 1630 n n 排排 序序: : 750 780 850 960 1080 1250 750 780 850 960 1080 1250 1500 1630 20001500 1630 2000 n n 位位 置置: : 1 2 3 4 1 2 3 4 5 5 6 6 n n 7 8 9 7 8 9 中位数中位数 10801080 n10个家庭的人均月收入数据 n n 排排 序序: : 660660 750 780 850 960 1080 1250 750 780 850 960 1080 1250 1500 1630 20001500 1630 2000 n n 位位 置置: : 1 2 3 4 1 2 3 4 5 65 6 7 7 n n 8 9 10 8 9 10 (2 2)单项式数列确定中位数)单项式数列确定中位数 对于单项式数列资料,由于变量值已经序列化,故对于单项式数列资料,由于变量值已经序列化,故 中位数的确定也很简单。中位数的确定也很简单。 步骤:步骤: 第一,求中位数位置第一,求中位数位置 ( 为总体单位数之为总体单位数之 和);和); 第二,计算各组的累计次数(向上或向下累计皆第二,计算各组的累计次数(向上或向下累计皆 可);可); 第三,根据中位数的位置找出中位数。第三,根据中位数的位置找出中位数。 (3 3)由组距分组数列确定中位数)由组距分组数列确定中位数 a.a.步骤步骤 由组距数列确定中位数,应先计算累计次数,然由组距数列确定中位数,应先计算累计次数,然 后确定中位数所在组的位置,最后再按比例推算后确定中位数所在组的位置,最后再按比例推算 中位数的具体数值。中位数的具体数值。 b.b.由分组资料确定中位数,中位数的位置是:由分组资料确定中位数,中位数的位置是: c.c.由组距数列计算中位数由组距数列计算中位数 v下限公式:(向上累计时用): v (向下累计时用) 身高 人数 累计 (CM) (人) 人数 150-155 3 3 155-160 11 14 160-165 34 48 165-170 24 72 170以上 11 83 总计 83 e.g,某年级83名 女生身高资料 vve.ge.g,某年某市某年某市8080个中型工业企业按照工业总个中型工业企业按照工业总 产值(按产值(按19801980年不变价格计算)的分组资料如年不变价格计算)的分组资料如 下:下: 由上表中的资料计算中位数: 首先,应确定中位数的位置。 f80, f /240,即中位数的位置是第40个 企业。 其次,应确定中位数的所在组。 第二组的累计次数为35,距离中位数的位置还差 5个企业;第三组的累计次数已达55,显然中位 数在第三组内。 第三,按比例推算中位数在组内的具体位置。 v因而,某市80个中型工业企业工业总产值的中位数,按 下限公式计算为: (四)分位数(四)分位数(简介)(简介) 1.概念 能够将全部总体单位按标志值大小等分为能够将全部总体单位按标志值大小等分为k k个个 部分的数值称为部分的数值称为“ “k k分位数分位数” ”。 2.常用的分位数 四分位数、十分位数和百分位数。四分位数、十分位数和百分位数。 中位数实际上是一个两分位数中位数实际上是一个两分位数 四、各种平均数的比较四、各种平均数的比较 (一)算术平均数、几何平均数和调和平均数三者的(一)算术平均数、几何平均数和调和平均数三者的 关系。(证明略)关系。(证明略) (二)数值平均数和位置平均数的比较(二)数值平均数和位置平均数的比较 (1 1)数值平均数对于数据的概括能力比位置平均数)数值平均数对于数据的概括能力比位置平均数 强。强。 (2 2)数值平均数和位置平均数对数据变化的)数值平均数和位置平均数对数据变化的“ “灵敏度灵敏度 ”“”“耐抗性耐抗性” ”不同。不同。 (3 3)数值平均数和位置平均数使用的数据类型不同)数值平均数和位置平均数使用的数据类型不同 。 众数、中位数、平均数的众数、中位数、平均数的特点和应用特点和应用 1.1.众数众数 n n 不受极端值影响不受极端值影响 n n 具有不惟一性具有不惟一性 n n 数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用 2.2.中位数中位数 n n 不受极端值影响不受极端值影响 n n 数据分布偏斜程度较大时应用数据分布偏斜程度较大时应用 3.3.平均数平均数 n n 易受极端值影响易受极端值影响 n n 数学性质优良数学性质优良 n n 数据对称分布或接近对称分布时应用数据对称分布或接近对称分布时应用 (三)算术平均数与众数、中位数在钟形分布时三种(三)算术平均数与众数、中位数在钟形分布时三种 集中趋势的关系集中趋势的关系 (1 1)当总体分布呈对称状态时,三者合而为一,即)当总体分布呈对称状态时,三者合而为一,即 三者相等。三者相等。 (2 2)当总体分布呈右偏,则中位数大于众数,小于)当总体分布呈右偏,则中位数大于众数,小于 算术平均数。算术平均数。 (3 3)当总体分布呈左偏,则中位数大于算术平均数)当总体分布呈左偏,则中位数大于算术平均数 ,小于众数。,小于众数。 以上第以上第2 2、3 3种情况均为总体分布呈非对称状态,这时种情况均为总体分布呈非对称状态,这时 三者之间就存在着一定的差别,愈不对称,差别越三者之间就存在着一定的差别,愈不对称,差别越 大。大。 英国统计学家卡尔英国统计学家卡尔. .皮尔逊认为,当分布只是适皮尔逊认为,当分布只是适 当偏态时,三者之间的数量关系是当偏态时,三者之间的数量关系是: : 中位数一般介于众数和均值之间,中位数与算中位数一般介于众数和均值之间,中位数与算 术平均数的距离是众数与算术平均数距离的三术平均数的距离是众数与算术平均数距离的三 分之一,即关系式为:分之一,即关系式为: 或或 第二节第二节 分布的离散程度分布的离散程度 vv一、变异指标概述一、变异指标概述 vv二、极差二、极差 vv三、平均差三、平均差 vv四、方差和标准差四、方差和标准差 vv五、变异系数五、变异系数 一、变异指标概述一、变异指标概述 (一)概念(一)概念 标志变异指标标志变异指标是反映统计数列中以平均数为中心,总体是反映统计数列中以平均数为中心,总体 各单位标志值的差异大小范围或离差程度的指标。各单位标志值的差异大小范围或离差程度的指标。 变异指标是评价平均数代表性的依据。变异越大,平均变异指标是评价平均数代表性的依据。变异越大,平均 数的代表性越差;反之,越好。数的代表性越差;反之,越好。 EgEg. .某车间有两个生产小组,都是某车间有两个生产小组,都是7 7名工人,各人日产件数:名工人,各人日产件数: 甲组:甲组:2020,4040,6060,7070,8080,100100,120120; 乙组:乙组:6767,6868,6969,7070,7171,7272, 7373; 甲、乙两组的平均每人日产量都为甲、乙两组的平均每人日产量都为7070件。件。 虽然两组平均日产量相等,但甲组各工人日产件数相差很大虽然两组平均日产量相等,但甲组各工人日产件数相差很大 ,分布很散;而乙组各工人日产件数相差不大,分布相对集,分布很散;而乙组各工人日产件数相差不大,分布相对集 中。平均数中。平均数7070件对甲组来说代表性不如对乙组的代表性大。件对甲组来说代表性不如对乙组的代表性大。 ( (二二) )标志变异指标的作用标志变异指标的作用 1.1.标志变异指标可以衡量平均数代表性的大小标志变异指标可以衡量平均数代表性的大小 。 2.2.标志变异指标可以反映社会经济活动过程的标志变异指标可以反映社会经济活动过程的 节奏性和均衡性。节奏性和均衡性。 3.3.标志变异指标可以反映总体单位标志值的均标志变异指标可以反映总体单位标志值的均 匀性和稳定性。匀性和稳定性。 4.4.标志变异指标是科学地确定必要的抽样单位标志变异指标是科学地确定必要的抽样单位 数应考虑的重要因素。数应考虑的重要因素。 (三)常见的变异指标(三)常见的变异指标 vv极差(全距)极差(全距) vv分位差分位差 vv平均差平均差 vv标准差标准差 vv离散系数(变异系数)离散系数(变异系数) 二、极差二、极差 1.1.概念概念 极差又称极差又称“ “变异全距变异全距” ”,它是总体各单位标志的,它是总体各单位标志的 最大值与最小值之差,通常用最大值与最小值之差,通常用“ “R”R”表示。表示。 2.2.计算计算 极差最大标志值最小标志值 极差最高组上限最低组下限 如前例,甲组日产件数的极差如前例,甲组日产件数的极差,R=120,R=12020201010(件)(件) 乙组日产件数的极差乙组日产件数的极差,R=73,R=7367676 6(件)件) 3.3.意义意义 极差用以说明标志值变动范围的大小,极差越极差用以说明标志值变动范围的大小,极差越 小,说明变量值越集中,变异程度越小;反小,说明变量值越集中,变异程度越小;反 之,之,R R数值越大,说明变量值越分散,变异程数值越大,说明变量值越分散,变异程 度越大。度越大。 极差说明分布的离散程度有两点不足之处:极差说明分布的离散程度有两点不足之处: 它取决于两个极端值的大小,不能反映中间它取决于两个极端值的大小,不能反映中间 数据的分布情况;数据的分布情况; 受极端值的影响过于显著,对数据的变化反受极端值的影响过于显著,对数据的变化反 映不敏感。映不敏感。 三、分位差三、分位差 vv分位差是对极差的改进,也就是从变量数列分位差是对极差的改进,也就是从变量数列 中剔除了一部分极端值后重新计算的类似于极中剔除了一部分极端值后重新计算的类似于极 差的指标。差的指标。 vv自己看书(自己看书(p77p77) 四、平均差四、平均差 1.1.概念概念 总体中各单位对其平均数的离差绝对值的算术平总体中各单位对其平均数的离差绝对值的算术平 均数,通常用均数,通常用“ “A.D.”A.D.”表示。表示。 2.2.意义意义 平

    注意事项

    本文(第一部分分布的集中趋势第二部分分布的离散程度.ppt)为本站会员(本田雅阁)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    经营许可证编号:宁ICP备18001539号-1

    三一文库
    收起
    展开