欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 研究报告>
  • 工作总结>
  • 合同范本>
  • 心得体会>
  • 工作报告>
  • 党团相关>
  • 幼儿/小学教育>
  • 高等教育>
  • 经济/贸易/财会>
  • 建筑/环境>
  • 金融/证券>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > PPT文档下载
     

    应用2统计量的计算和箱线图.ppt

    • 资源ID:3436592       资源大小:1.77MB        全文页数:28页
    • 资源格式: PPT        下载积分:6
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录   微博登录  
    二维码
    微信扫一扫登录
    下载资源需要6
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    应用2统计量的计算和箱线图.ppt

    语言研究中的统计学 () 2009 年 3 月,山西大学数学科学学院,1,语言研究中的统计学,基本统计量,语言研究中的统计学,2,山西大学数学科学学院,(一)平均数(样本均值),语言研究中的统计学,3,山西大学数学科学学院,1、算术平均 根据频数分布表 根据分组频数分布表 2、加权平均,加权平均数例子,语言研究中的统计学,4,山西大学数学科学学院,例1 有3个班,人数分别为20、30和40,在某次考试中的平均成绩分别为85,75,80,那么这三个班的加权总平均成绩为: 例2 综合测评成绩的计算: 注意:权大小的确定要有一定的依据。 特别地:如果所有权的和为1,则称为标准权。,(二)中位数,语言研究中的统计学,5,山西大学数学科学学院,顺序样本中间位置的数, 即样本容量(总次数)N的50%位置的数。 1、对未分组数据求中位数 2、根据分组频数分布表求中位数 或,L 中位数所在组下限 U 中位数所在组上限 fL L以下各组总次数 fU U以上各组总次数 F 中数所在组次数 i 中数所在组组距,(三)众数,语言研究中的统计学,6,山西大学数学科学学院,一组数据中出现次数最多的数值 注意: 1、如组中各数都相同,则没有众数; 2、也可能出现两个以上的众数; 3、称含有两个众数的次数分布为双众数分布。 求法: 从顺序样本中找,样本容量大的,先做频数统计表。,平均数、中位数和众数的关系,7,皮尔逊经验公式(P40) 众数=3*中位数-2*平均数,山西大学数学科学学院,语言研究中的统计学,平均数、中位数和众数的比较,语言研究中的统计学,8,山西大学数学科学学院,1、灵敏度 平均数的计算涉及到每个样本值,所以对数值的变化比较敏感。 2、稳定性 对同一总体而言,均值比较稳定,受抽样影响较小。 3、信息量 平均数既反映了数值的顺序关系,又体现了所有样本的值,同时又稳定,所以它所提供的信息量最大。 4、运算 平均数适合代数运算,且比较简单。,平均数、中位数和众数的比较,语言研究中的统计学,9,山西大学数学科学学院,6、极端值 样本中过大或过小的数值称为极值 平均值不能体现极端值的信息,从而不能很好地反映分布的信息,有时中数和众数更好一点。 7、数据分布 对于对称分布,三数非常接近,特别是正态分布时三数相等; 对偏态分布,三数差异较大,一般地: 正偏或右偏时,众数中位数平均数 负偏或左偏时,平均数中位数众数,平均数、中位数和众数的比较,语言研究中的统计学,10,山西大学数学科学学院,三数各有优缺点,平均数用得比较多。,正态分布,三数相同,正偏或右偏 众数中位数平均数,负偏或左偏 平均数中位数众数,语言研究中的统计学,11,山西大学数学科学学院,(四)极差,极差又称两极差,是样本值中最大值和最小值之间的差。,Xmax,语言研究中的统计学,12,山西大学数学科学学院,(五)四分差,定义:,分组数据四分点的求法:,语言研究中的统计学,13,山西大学数学科学学院,(六)(绝对)平均差(AD),定义:,分组数据平均差的求法:,注意到:,所以我们需要取绝对值。,其中称右式为离均差:,语言研究中的统计学,14,山西大学数学科学学院,(七)方差与标准差,未分组数据:,变形一,变形二,由次数分布表来求更简单一些。略,语言研究中的统计学,15,山西大学数学科学学院,(七)方差与标准差(续),由分组次数分布表:,式中: f为组频数; d为各组数据的假定平均离均差, 其中Xc为各组组中值,A为估计平均值。 N为总次数,i为组距。,A的确定:取总次数一半的累积次数所对应的那一组的组中值,因为它更接近真正的平均值。,语言研究中的统计学,16,山西大学数学科学学院,离中趋势量的比较,极差可以在一定程度上反映数据的差异情况,为数据分组提供依据; 四分差比两级差稳定可靠,常与中位数结合使用; 平均差优于两级差和四分差,用数值离开平均值的平均距离来反映数据的离散程度,但不适合微分运算; 方差和标准差是最理想的差异量:概念易于理解,适合代数运算和微分运算,能反映所有数据的差异情况,不易受抽样的影响。,一个分数在一组分数中的位置是参照该组分数的典型分数来确定的,也就是说,一个分数可以描述为在典型分之上还是之下或者是等于典型分,以及它离开典型分有多远。这个典型分数用平均分表示,离开典型分的距离用标准差表示,这样我们就可以是“某个分数离开平均分多少个标准差单位”,同时用正负号表示该分数处于平均分之上还是之下。 这实际上就是把原始分数转换为标准差单位数,或以标准差为单位来表示一个分数与平均数的差,此过程称为标准化过程,语言研究中的统计学,17,山西大学数学科学学院,标准化,语言研究中的统计学,18,山西大学数学科学学院,标准分,一个分数离开平均分的“标准差单位数”称为标准分或Z分,常用Z表示。 标准分的性质: 一组分数的标准分的和为零,即 ; 一组分数的标准分之平均值为0,即 ; 一组分数的标准分之标准差为1,即 ; 标准分具有对称性。 标准分的应用: 比较不同质(不同分布)的分数; 将不同质的多个分数合成后再比较。,语言研究中的统计学,19,山西大学数学科学学院,标准分与百分位对照表,五数概括与箱线图,20,对有序样本,容易计算以下五个值(五数): 最小观测值xmin;最大观测值xmax;中位数m0.5=Q2; 第一个四分位数Q1= m0.25;第三个四分位数Q3= m0.75; 箱线图(Box plot),又称箱须图(Box-whisker Plot) 、盒形图、箱图、盒子图。作法如下: 画一个箱子,其两侧恰为第一4分位数和第三4分位数,在中位数位置画一条竖线。这个箱子包含了50%的数据。 在箱子左右两侧各引一条水平线,分别至最小值和最大值,每条线段包含25%的数据。,山西大学数学科学学院,语言研究中的统计学,箱线图,21,箱线图可以对样本数据的分布形状进行大致的判断。,山西大学数学科学学院,语言研究中的统计学,箱线图,22,箱线图可以对样本数据的分布形状进行大致的判断。 例:以下是100个英语句子的长度。,山西大学数学科学学院,语言研究中的统计学,练习,23,山西大学数学科学学院,语言研究中的统计学,练习,24,山西大学数学科学学院,语言研究中的统计学,练习,25,山西大学数学科学学院,语言研究中的统计学,直方图,26,山西大学数学科学学院,语言研究中的统计学,Stem-and-Leaf Plots,27,山西大学数学科学学院,语言研究中的统计学,V1 Stem-and-Leaf Plot Frequency Stem & Leaf 8.00 0 . 68889999 19.00 1 . 0001122222233334444 27.00 1 . 555566666667777778888899999 18.00 2 . 000001112222333444 9.00 2 . 566667899 1.00 3 . 4 4.00 3 . 5679 6.00 4 . 000444 8.00 Extremes (=47) Stem width: 10 Each leaf: 1 case(s),箱线图,28,山西大学数学科学学院,语言研究中的统计学,奇异值用o表示。 表示数值与矩形框的上边(下边)的距离是四分位极差的1.5倍3倍;,极端值用*表示。 表示数值与矩形框的上边(下边)的距离是四分位极差的3倍以上;,

    注意事项

    本文(应用2统计量的计算和箱线图.ppt)为本站会员(本田雅阁)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    经营许可证编号:宁ICP备18001539号-1

    三一文库
    收起
    展开