第2章资料的整理及特征数的计算.ppt
《第2章资料的整理及特征数的计算.ppt》由会员分享,可在线阅读,更多相关《第2章资料的整理及特征数的计算.ppt(52页珍藏版)》请在三一文库上搜索。
1、第二章 资料的整理与特征 数的计算,第一节 试验资料的搜集与整理,第二节 特征数的计算,一、试验资料的类型,资料: 鱼的尾数、人的个数、猪的体重、奶牛的产奶量、花的颜色、人的血型 、疾病治疗的疗效,数量性状资料: 计数资料 (如鱼的尾数,以正整数出现) 计量资料(如人的身高,依试验的要求和测量仪器或工具的精度) 质量性状资料: 对某种现象只能观察而不能测量 如,动物的雌雄;茸毛的有无;人的血型 数量化(统计次数法; 评分法),二、试验资料的整理,原始资料的检查与核对 次数分布表 次数分布图,当观测值不多(n30)时,不必分组,直接进行统计分析。 当观测值较多(n30)时,宜分成若干组,以便统计
2、分析。将观测值分组后,制成次数分布表,即可看到资料的集中和变异情况。,表2-1 50枚受精种蛋孵化出雏鸡的天数,(一)计数资料的整理 1、观测数较少时: 现以50枚受精种蛋孵化出雏鸡的天数为例,表2-1 50枚受精种蛋出雏天数的次数分布表,2、观察值较多,且变异范围较大时, 可扩大为以几个相邻观察值为一组,适当减少组数,这样资料的规律性就较明显 例如,观测某品种100只蛋鸡每年每只鸡产蛋数(原始资料略),其变异范围为200-299枚。 经初步整理后分为10组,资料的规律性就比较明显,见表2-4。,表2-3 100只蛋鸡每年产蛋数的次数分布表,(二)计量资料的整理 计量资料在分组前需要确定全距、
3、组数、组距、组中值及组限,然后将全部观测值划线计数归组。 【例2.1】 将126头母羊的体重资料(见表2-4)整理成次数分布表。,表2-4 126头母羊的体重资料 单位:kg,1、求全距 全距是资料中最大值与最小值之差,又称为极差(range),用R表示,即 R=Max(x)-Min(x) 本例 R=65.0-37.0=28.0(kg),2、确定组数 组数的多少视样本含量及资料的变动范围大小而定,一般以达到既简化资料又不影响反映资料的规律性为原则。 分组越多所求得的统计量越精确,但增大了运算量;若分组过少,资料的规律性就反映不出来,计算出的统计量的精确性也较差。一般组数的确定,可参考表2-5。
4、,表2-5 样本含量与组数 本例中,n126,根据表2-5,初步确定组数为10组。,3、确定组距 每组最大值与最小值之差称为组距,记为 i。分组时要求各组的组距相等。组距的计算公式为: 组距(i)全距组数 本例 i28.0103.0,4、确定组限及组中值 各组的最大值与最小值称为组限。最小值称为下限, 最大值称为上限。每组的中点值称为组中值; 上限不计入原则; 在分组时为了避免第一组中观察值过多,一般第一组的组中值以接近或等于资料中的最小值为好;最末一组的上限应大于资料中的最大值。,表2-4中, 最小值为37.0, 第一组的组中值取37.5,因组距已确定为3.0,所以 第一组的下限为: 37.
5、5-(1/2)3.036.0; 第一组的上限也就是第二组的下限为: 36.0+3.0=39.0; 第二组的上限也就是第三组的下限为: 39.0+3.0=42.0, 以此类推,一直到某一组的上限大于资料中的最大值为止, 于是可分组为: 36.0 39.0,39.0 42.0,。,5、归组划线计数,作次数分布表 分组结束后,将资料中的每一观测值逐一归组,划线计数,然后制成次数分布表。,表2-7 126头母羊的体重的次数分布表,表2-7 126头母羊的体重的次数分布表,第二节 特征数的计算,集中性是变量在趋势上有着向某一中心聚集,或者说以某一数值为中心而分布的性质。反映集中性的特征是平均数,常用算术
6、平均数。此外还有几何平均数、中位数和众数等。 离散性是变量有着离开中心分散变异的性质,常用的指标是极差、方差、标准差和变异系数等。,如: 1, 2, 3, 4, 5 2, 2.5, 3, 3.5, 4,集中性一致, 但离散性不同,平均数是统计学中最常用的统计量,用来表明资料中各观测值相对集中较多的中心位置。平均数主要包括有: 算术平均数(arithmetic mean) 中位数(median) 众数(mode) 几何平均数(geometric mean) 调和平均数(harmonic mean),一、平均数:,算术平均数是描述观测资料的重要特征数,它的作用主要有以下两点: 指出一数据资料内变量
7、的中心位置,标志着资料所代表性状的数量水平和质量水平 作为样本或资料的代表数与其他资料进行比较。,算术平均数是指资料中各观测值的总和除以观测值个数所得的商,简称平均数或均数 算术平均数可根据样本大小及分组情况而采用直接法或加权法计算。 (一)直接法 主要用于样本含量n30以下、未经分组资料平均数的计算。,设某一资料包含n个观测值: x1、x2、xn, 则样本平均数可通过下式计算: 其中,为总和符号; 表示从第一个观测值x1累加到第n个观测值xn。当 在意义上已明确时,可简写为x, 上式可改写为:,【例3.1】 某种公牛站测得10头成年公牛的体重分别为500、520、535、560、585、60
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 资料 整理 特征 计算
链接地址:https://www.31doc.com/p-2986790.html