欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 研究报告>
  • 工作总结>
  • 合同范本>
  • 心得体会>
  • 工作报告>
  • 党团相关>
  • 幼儿/小学教育>
  • 高等教育>
  • 经济/贸易/财会>
  • 建筑/环境>
  • 金融/证券>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > PPT文档下载
     

    第三章 试验资料的整理及其特征数.ppt

    • 资源ID:5030444       资源大小:1.10MB        全文页数:64页
    • 资源格式: PPT        下载积分:8
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录   微博登录  
    二维码
    微信扫一扫登录
    下载资源需要8
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第三章 试验资料的整理及其特征数.ppt

    第三章 试验资料的整理及特征数,&3.1 常用的统计术语 &3.2 试验资料的性质与分类 &3.3 试验资料的整理 &3.4 试验资料的特征数 补讲:计算器统计相关功能的使用,&3.1 常用的统计术语,一、总体(population)和样本(sample),1.总体:据研究目的确定的研究对象的全体 个体:总体中的一个研究单位称个体(individual)。 总体分:有限总体和无限总体。,.样本:总体的一部分称为样本。 样本容量:样本中所包含的个体数目叫样本容量(sample size),常记为n。,3.为什么要随机抽样?,随机样本(random sample) 非随机样本(non-random sample),n30的样本叫小样本,n30的样本叫大样本。,(1)集团个体数多或无限 (2)有些是破坏性的试验,4.总体与样本的关系 样本是集团的缩影,但不等于集团,抽样是一种手段。,看图,统计分析的核心在于由样本的情况推断集团的信息,保证一定精确度、可靠度。,由样本推断总体虽然有很大可靠性,也有一定错误率。俗语说“不可不信,不可全信”,这是我们对待统计推断的正确态度。,图总体与样本,二、变数与变量,每一个体的某一性状、特性的测定数值叫做观察值(observation)。,观察值集合起来,称为变数(variable),变数中的每一成员称为变量(variate),随机变数(mndomvariable),三、参数与统计数,1.参数(parameter): 用总体的全部观察值而算得的、描述总体的特征数称为参数。,2.统计数(statistics):由样本的全部观察值算得的、描述样本的特征数。,如:样本平均数-,样本均方-,统计上,通常由样本统计数估计或推断总体相应参数。,&3.2 试验资料的性质与分类,1、数量性状资料,凡是能够以量测或计数的方法表示其特征的性状统称为数量性状。,观察测定数量性状而获得的数据就是数量性状资料,分为(1)计量资料 (2)计数资料 。,试验资料分两大类:数量性状资料和质量性状资料,各个观察值不一定是整数,两个相邻的整数间可有带小数的任何数值出现;计量资料也称之为连续性变异资料.,凡用称量、测量等量测手段得到的数量性状资料。,(1)计量资料,它的各个观察值须以整数表示,两个相邻整数间不容许任何带有小数的值存在。因此,该类资料也称非连续性变异资料或称间断性资料。,指用计数方式得到的数据资料.,(2)计数资料,质量性状是指只能观察而不能测量的性状。 如花药、茎、种子、果实、叶片的颜色、籽粒的饱满度、芒的有无等。,质量性状本身不能用数值表示,要获得这类性状的资料,须对其观察结果作数量化处理。 数量化方法可分两种: (1)统计次数法 (2)分级法,2、质量性状资料,在一个样本内,分别统计具有某种性状、不具有该性状的个体数,这种数量化的资料又叫次数资料。,例如 1.调查国光苹果的裂果情况; 2.一个玉米果穗上甜粒与非甜粒的比率。,(1)统计次数法,先根据性状的变异情况分级,给每级 分别赋予一个适当的数值作代表值,然后统计样本中属于各个级别的个体数。,例如 调查作物受某种病虫害危害情况,将作物性状分为高抗、抗、中抗、中感、感病5个级别,分别用1,2,3,4,5表示,统计样本内各种级别的植株数。,(2)分级法,&3.3 试验资料的整理,试验资料整理为次数分布 次数分布:由不同区间内变量的次数组成的分布。 次数分布功用:整理资料、化繁为简;初步了解变数的分布特点;便于进一步的计算和分析。 将次数分布作成表格形式叫次数分布表 次数分布以图来表示叫次数分布图。,(一)计量资料的次数分布表 计量资料在分组前需要确定组数、组距、各组中值及组限,然后将全部观测值划线计数归组。,一、次数分布表,书例p38 以表34的140行水稻试验的产量为例,说明整理方法。,表3.4 140行水稻产量(单位:克),1. 数据排序(sort) 2. 求极差(range) :R=254-75=179g。,3. 确定组数和组距(class interval),应考虑:(1)观察值个数的多少(n=140) (2)能反映出资料的真实面貌等方面。,表3.5 样本容量与组数多少的关系 样本容量 分组时的组数 50 510 100 816 200 1020 300 1224 500 1530 1000 2040,本例R179,分为12组. 为了便于计算,组距一般取整数。 组距: C=R/组数=179/12=14.915(g),4. 确定组中值与组限 第一组组中值接近等于资料中最小值、取整为好。,第一组 下限 组中值 上限 67.5=c/2- 75 +c/2=82.5 +c +c +c 第二组 82.5 90 97.5 类推 ,5.原始资料归组,表 140行水稻的次数分布 组 限 中点值( y ) 次数( f ) 67.5 82.5 75 2 82.5 97.5 90 7 97.5112.5 105 7 112.5127.5 120 13 127.5142.5 135 17 142.5157.5 150 20 157.5172.5 165 25 172.5187.5 180 21 187.5202.5 195 13 202.5217.5 210 9 217.5232.5 225 3 232.5247.5 240 2 247.5262.5 255 1 合计( n ) 140,(二)计数资料的次数分布表,变异较小的资料,可按观察值分组。 例如p37:某小麦品种的每穗小穗数的次数分布 (n=100原始资料表3.1略),变异较大的计数资料,可按一定幅度的方法制作次数分布表。,表3.3 200个稻穗每穗粒数的次数分布表,(三)质量性状资料的次数分布表,例如,用某微肥处理后,红星苹果果实着色情况调查,见下表。,再例 表3.7 水稻杂种二代植株米粒性状的分离情况,二、次数分布图,次数分布图可以更形象地表明次数分布的情况。 常用:方柱形图、多边形图、条形图和饼图。,例:以140行水稻产量次数发布表基础上制作柱形图,图3.1 140行水稻产量次数分布方柱形图,(二)多边形图(折线图),适用于计量资料的次数分布图,且在同一图上可比较两组以上资料。,图3.2 140行水稻产量次数分布多边形图,(三) 条形图,适用于计数资料和质量性状资料。,图3.3 水稻F2代米粒性状分离条形图,(四) 饼图,饼图(pie)适用于间断性变数和属性变数资料,用以表示这些变数中各种属性或各种间断性数据观察值在总观察个数中的百分比。,图3.4 水稻F2代米粒性状分离的饼图,&3.4 试验资料的特征数,资料整理得的次数分布表、图,形象直观地反映了资料两特点:集中性和离散性,现介绍用更简单、精确的统计量来反映。,(一)平均数 反应资料集中性的特征数 (二)变异数 反应其离散性的特征数 (三)标准误 反应抽样误差的特征数,一、平均数,平均数种类较多常用的有:算术平均数、几何平均数、中位数、众数。 应用最普遍的是算术平均数。 平均数功用:是数量资料的代表数,可综合反映研究对象在一定条件下形成的一般水平,常用来进行资料间的比较。,(一)算术平均数,各个观察值的总和除以观察值个数所得的商,称为算术平均数(arithmetic mean),简称平均数。 通常用表示总体平均数, 表示样本平均数。,各个观察值的总和除以观察值个数所得的商,称为算术平均数(arithmetic mean),简称平均数。 通常用表示总体平均数, 表示样本平均数。,设有一个含N个观察值的有限总体,其观察值为x1,x,xN,则该总体的算术平均数定义为:,一般用样本平均数 作为总体平均数的估计值。,设有一个容量为n的样本,其观察值为 ,则该样本的算术平均数可定义为:,从总体中抽出的随机样本平均数 是该总体平均数的无偏估计值。,平均数的基本性质:,(1) 离均差之和等于零。记为:,(2) 离均差平方和为最小。简记为:,计算方法:,(1)直接算法,对于未归组的资料可以直接利用公式:,(2)加权法 对已归组的资料,其计算公式为:,其中: xi各组组中值;k组数; n 资料中所有观察值的个数; fi 各组次数;,【例2.2】在一水稻品种比较试验中,某品种的5个小区产量分别为 20.0,19.0,21.0,17.5,18.5(kg),求该品种的小区产量平均数。,=(20.0+19.0+21.0+17.5+18.5)/5= 19.2(kg) ,【例2.3】利用加权法求100株湘菊梨单株产量的算术平均数。,=(48.5×3+51.5×6+69.5×7+72.5×4)/100 60.92(kg),(二) 中数(Md) 将观察值按大小依次排列,当观察值数目为奇数时,最中间的观察值就是中数;当观察值数目为偶数时,最中间的两个观察值的算术平均数为中数。,如 2,2,3,4,7,8,9,11,14; 5,7,8,9,10,11;,(三) 众数( M ) 在资料中出现次数最多的数或组中值。,(四) 几何平均数( Mg ) 设有n个观察值,其乘积开n次方所得的值,即为几何平均数,即,如某一调查结果为: 3,4,3,3,5,6,4,3,2,2,(一) 极差(R) R最大值-最小值,二、变异数 极差、平方和、方差、标准差、变异系数等,它由两个极端观察值决定,受资料中不正常的极端值的影响大,没有充分利用资料的全部信息,不能精确表示资料的变异度。,(二) 方差与标准差,每个观察值与平均数之差即离均差;表示观察值偏离平均数的距离。 离均差的平方再求和简称平方和(sum of square),记为SS。即,1.引入标准差的必要性,平方和SS:,对总体:,对样本:,平方和(SS)的大小受观察值个数影响。为消除SS的这个缺陷,可将SS除以观察值的个数得到平均平方和,称之为方差 (variance)。 总体方差用 表示,即:,总体方差通常无法得到,而由样本方差估计,样本方差称为均方 (mean square)记为 或 MS :,上式中的(n-1)称为自由度(degree of freedom),简记为df。它是指样本内能独立自由变动观察值的个数。,【例2.4】 有5个观察值,其中4个观察值的离均差为3,-2,3,5,那么第5个观察值的离均差必为-9,才能满足:,在估计其他统计数时,如该统计数受k个条件限制,则自由度等于样本观察值个数减去约束条件数k,即样本自由度为n-k。,统计学上把方差或均方的平方根取正值称为标准差。,总体标准差:,样本标准差:,标准差的定义与计算式,项目,总和,20.0 19.0 21.0 17.5 18.5,96.0,20.0-19.2=0.8 19.0-19.2=-0.2 21.0-19.2=1.8 17.5-19.2=-1.7 18.5-19.2=-0.7,0.64 0.04 3.24 2.89 0.49,400.0 361.0 441.0 306.25 342.25,0,7.30,1850.50,例:某水稻品种5小区产量:20,19,21,17.5,18.5,试计算各种统计量。,(三)变异系数,统计上,为比较具有不同单位,或单位相同但平均值差异相差悬殊的两个样本之间的变异度,需用相对变异量。 变异系数(coefficient of variation):,【例2.7】今测得金柑树冠直径平均数为132cm,标准差为12cm,树干周长的平均数为15cm,标准差为 2cm,试比较其变异谁大?,解:冠径:CV12/ 132×100%9.09% 干周:CV2/15×100%13.33%,可见,虽然干周的平均数与标准差的绝对数比树冠直径小得多,但相对变异程度比冠径要大些。,思考题:葡萄品种果穗上有许多性状,其平均数、标准差及单位各不相同,判断以下性状变异大小。,变异系数,11.1 19.0 29.4,分析结果: 以果穗重的变异最大,其次是果粒数,再则为小穗数。,补:平均数与标准差的简算公式,1. 数值缩减法(同时减一常数),2. 化整计算法(同乘常数),三、标准误,1. 样本均数集团及其与原集团的关系,(1) 样本均数集团,(2) 样本均数集团与原集团的关系,2. 标准误定义式,均数标准差(简称标准误)定义式:,(1) 标准误的功用: 衡量资料的变异性,估计抽样误差。,3. 标准误的功用及其与标准差的区别,(2)理解标准差与标准误的区别: a样本标准差估计同一个集团内各个个体,由于立地环境条件不同而产生的变异有多大。 b标准误反映同一个集团内抽样所得的样本平均数间的差异。,补讲:计算器统计相关功能的使用,1状态选择键() (度、四则运算状态) (弧度) (百分度),2小数位(定位键),3- 屏幕上数字转为内存变换键 寄存器读出键 屏幕出现 输入后,按- 清除内存的数字,4统计专用键 (或) 与、2 、 、等。 注意选择状态 熟练用或键,练习:35.6 37.6 33.4 35.1 32.7 36.8 35.9 34.6,计算各种统计量。,

    注意事项

    本文(第三章 试验资料的整理及其特征数.ppt)为本站会员(韩长文)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    经营许可证编号:宁ICP备18001539号-1

    三一文库
    收起
    展开