应用2统计量的计算和箱线图.ppt
《应用2统计量的计算和箱线图.ppt》由会员分享,可在线阅读,更多相关《应用2统计量的计算和箱线图.ppt(28页珍藏版)》请在三一文库上搜索。
1、语言研究中的统计学 () 2009 年 3 月,山西大学数学科学学院,1,语言研究中的统计学,基本统计量,语言研究中的统计学,2,山西大学数学科学学院,(一)平均数(样本均值),语言研究中的统计学,3,山西大学数学科学学院,1、算术平均 根据频数分布表 根据分组频数分布表 2、加权平均,加权平均数例子,语言研究中的统计学,4,山西大学数学科学学院,例1 有3个班,人数分别为20、30和40,在某次考试中的平均成绩分别为85,75,80,那么这三个班的加权总平均成绩为: 例2 综合测评成绩的计算: 注意:权大小的确定要有一定的依据。 特别地:如果所有权的和为1,则称为标准权。,(二)中位数,语言
2、研究中的统计学,5,山西大学数学科学学院,顺序样本中间位置的数, 即样本容量(总次数)N的50%位置的数。 1、对未分组数据求中位数 2、根据分组频数分布表求中位数 或,L 中位数所在组下限 U 中位数所在组上限 fL L以下各组总次数 fU U以上各组总次数 F 中数所在组次数 i 中数所在组组距,(三)众数,语言研究中的统计学,6,山西大学数学科学学院,一组数据中出现次数最多的数值 注意: 1、如组中各数都相同,则没有众数; 2、也可能出现两个以上的众数; 3、称含有两个众数的次数分布为双众数分布。 求法: 从顺序样本中找,样本容量大的,先做频数统计表。,平均数、中位数和众数的关系,7,皮
3、尔逊经验公式(P40) 众数=3*中位数-2*平均数,山西大学数学科学学院,语言研究中的统计学,平均数、中位数和众数的比较,语言研究中的统计学,8,山西大学数学科学学院,1、灵敏度 平均数的计算涉及到每个样本值,所以对数值的变化比较敏感。 2、稳定性 对同一总体而言,均值比较稳定,受抽样影响较小。 3、信息量 平均数既反映了数值的顺序关系,又体现了所有样本的值,同时又稳定,所以它所提供的信息量最大。 4、运算 平均数适合代数运算,且比较简单。,平均数、中位数和众数的比较,语言研究中的统计学,9,山西大学数学科学学院,6、极端值 样本中过大或过小的数值称为极值 平均值不能体现极端值的信息,从而不
4、能很好地反映分布的信息,有时中数和众数更好一点。 7、数据分布 对于对称分布,三数非常接近,特别是正态分布时三数相等; 对偏态分布,三数差异较大,一般地: 正偏或右偏时,众数中位数平均数 负偏或左偏时,平均数中位数众数,平均数、中位数和众数的比较,语言研究中的统计学,10,山西大学数学科学学院,三数各有优缺点,平均数用得比较多。,正态分布,三数相同,正偏或右偏 众数中位数平均数,负偏或左偏 平均数中位数众数,语言研究中的统计学,11,山西大学数学科学学院,(四)极差,极差又称两极差,是样本值中最大值和最小值之间的差。,Xmax,语言研究中的统计学,12,山西大学数学科学学院,(五)四分差,定义
5、:,分组数据四分点的求法:,语言研究中的统计学,13,山西大学数学科学学院,(六)(绝对)平均差(AD),定义:,分组数据平均差的求法:,注意到:,所以我们需要取绝对值。,其中称右式为离均差:,语言研究中的统计学,14,山西大学数学科学学院,(七)方差与标准差,未分组数据:,变形一,变形二,由次数分布表来求更简单一些。略,语言研究中的统计学,15,山西大学数学科学学院,(七)方差与标准差(续),由分组次数分布表:,式中: f为组频数; d为各组数据的假定平均离均差, 其中Xc为各组组中值,A为估计平均值。 N为总次数,i为组距。,A的确定:取总次数一半的累积次数所对应的那一组的组中值,因为它更
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 应用 统计 计算 线图
链接地址:https://www.31doc.com/p-3436592.html