欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 研究报告>
  • 工作总结>
  • 合同范本>
  • 心得体会>
  • 工作报告>
  • 党团相关>
  • 幼儿/小学教育>
  • 高等教育>
  • 经济/贸易/财会>
  • 建筑/环境>
  • 金融/证券>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > PPT文档下载
     

    8-直线回归与相关13-.ppt

    • 资源ID:3470906       资源大小:767.52KB        全文页数:37页
    • 资源格式: PPT        下载积分:6
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录   微博登录  
    二维码
    微信扫一扫登录
    下载资源需要6
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    8-直线回归与相关13-.ppt

    第八章 直线回归与相关分析,统计关系是一种非确定关系,即一个变数的取值受到另一变数的影响,两者之间有关系,但又不存在完全确定的函数关系。如: 施肥量与产量的关系 药物浓度与反应率的关系;,一、函数关系与统计关系 函数关系是一种确定的关系。例如圆面积与半径的关系为:,第一节 直线回归与相关的基本概念,二、自变数与依变数 对据有统计关系的两个变数,分别用变数符号Y 和X 表示。根据两个变数的作用特点,统计关系又可分为因果关系和相关关系两种。 两个变数间的关系若有原因和反应(结果)的性质,则称这两个变数间存在因果关系,并定义原因变数为自变数,以X 表示;定义结果变数为依变数,以Y 表示。,如果两个变数并不是原因和结果的关系,是一种平行关系,呈现一种共同变化的特点,则称这两个变数间存在相关关系。如在人的身高和体重关系中,它们不是互为因果,而是同步增长、互有影响的。 相关关系中没有自变数和依变数之分。,相关关系:,(1)对具有因果关系的两个变数,统计分析的任务是由实验数据推算出一个表示Y 随X 的改变而改变的方程 ,称之为回归方程(regression equation of Y on X ),这一过程称为回归分析。 (2)对具有相关关系的两个变数,统计分析的目标是计算表示Y和X相关密切程度的统计数,并测验其显著性。这一过程称为相关分析。,三、回归分析和相关分析,相关分析只能研究两个变数y和x相关密切程度,而不能用一个变量去预测和控制另一个变量的变化,这是回归分析和相关分析区别的关键所在。 但二者不能截然分开,由回归分析可以获得相关的一些重要信息,由相关分析可以获得回归的一些重要信息。 对于同一资料来说,回归系数和相关系数进行显著性检验,都是检验该总体有无直线关系。对于同一资料,回归显著,相关显著;反之也成立。,回归分析和相关分析:,四、两个变数资料的散点图 将两个变数的n对观察值(x1,y1)、(x2,y2)、(xn,yn)分别以坐标点的形式标记于同一直角坐标平面上得到的图,称为散点图(scatter diagram)。,1,2,3,4,x,生物产量(g),0.0,0.5,1.0,1.5,2.0,y,稻谷产量(g),水稻单株生物产量与稻谷产量的散点图,3.2,3.6,4,4.4,4.8,x,每平方米颖花数(万),0,55,60,65,70,75,y,结实率(%),水稻每平方米颖花数和结实率的散点图,x,最高叶面积指数,y,产量(kg/亩),水稻最高叶面积指数和亩产量的散点图,利用散点图判断相关性质及密切程度,r-1 (d),r1 (b),0r1 (a),-1r0 (c),正向直线相关,负向直线相关,完全正直线相关,完全负直线相关,第二节 直线回归分析,称为直线回归方程(linear regression equation)。其中a 是x=0时的 值,即回归直线在y 轴上的截距,叫回归截距(regression intercept); b 是回归直线的斜率,表示x 每增加一个单位数时, y 平均增加(b0时)或减少(b0时)的单位数,叫回归系数(regression coefficeint)。,一、直线回归方程式,从上图得知,要使 能够最好地代表y和x在数量上的互变关系,必须使,y,x,二、求a和b值,分别对a和b求偏导并令其为0,即:,式中 是x的离均差和y的离均差的乘积之和,简称乘积和(sum of products),记作SP。,例7.1一些夏季害虫盛发期的早迟和春季温度高低有关。江苏武进连续9年测定3月下旬至4 月中旬旬平均温度累积值(x,旬.度)和水稻一代三化螟盛发期(y,以5月10日为0)的关系,得结果于下表。试计算其直线回归方程。,三、直线回归方程的计算,解:1.由观察值计算一级数据,2. 由一级数据计算二级数据,3.求a和b值,4. 求回归方程:,当3月下旬至4月中旬的积温(x)每提高1旬·度时,一代三化螟的盛发期平均将提早1.1天;若积温为0,则一代三化螟的盛发期将在6月2728日(x=0时,y =48.5;因y是以5月10日为0,故48.5为6月2728日)。 但在应用回归方程预测时,需限定x的区间为31.7,44.2;如要在x31.7或44.2的区间外延,则必须有新的依据。,回归系数和回归截距的意义:,x,3月下旬至4月中旬旬平均温度累积值 旬平均温度累积值和一代三化螟盛发期的关系,四、直线回归方程的图示,五、直线回归的估计标准误 满足 为最小的直线回归方程和实测的观察点并不重合,表明该回归方程仍然存在随机误差。 Q 就是误差的一种度量,称之为离回归平方和或剩余平方和。,由于在建立回归方程时用了a 和b 两个统计数,故Q 的自由度=n-2。因而,可定义回归方程的估计标准误为:,Q值的计算:,(1)F 测验,第三节 直线回归的假设测验,一、直线回归的假设测验 1、回归关系的假设测验(t 测验和F测验只选择,例试用F测验法检测7.1资料回归关系的显著性。,说明积温和一代三化螟盛发期是有极显著的直线回归关系。,(2)t 测验 若总体不存在直线回归关系,则总体回归系数=0;若总体存在直线回归关系,则总体回归系数0。 所以对直线回归的假设测验为: H0:=0 对HA:0。 回归系数b的标准误为:,例试测验7.1资料回归关系的显著性。,查附表3,,接受HA:0,即认为积温和一代三化螟盛发期是有真实的直线回归关系。,第四节 相关分析,8.3.1 相关系数和决定系数,一、相关系数,设有一X、Y 均为随机变量的双变数总体,具有N对(X,Y)。若在标有这N个(X,Y)坐标点的直角坐标上移动坐标轴,将X轴和Y轴分别平移到X和Y上,则各点位置不变,而所取坐标变为(X-X,Y-Y)。,后者是由X的不同而引起。显然,若坐标点愈靠近回归线,则U对SSy的比率愈大,直线相关就愈密切,故样本的相关系数r 为:,从样本的角度分析,y 的平方和SSy是由离回归平方和 及回归平方和 构成的,,二、决定系数 决定系数(determination coefficient):由x 不同引起的 y 的平方和 占总平方和 的比率。,可见,决定系数即为相关系数r 的平方值。,三、相关系数的性质,-1 r 1 r的符号表示相关的性质 r0为零相关或不相关 r0为正相关 r0为负相关,r的绝对值表示相关的密切程度 r的绝对值越接近于1,相关越密切; r的绝对值越接近于0,相关越不密切; r的绝对值为0,零相关或不相关; r的绝对值为1,完全相关 r=1,完全正相关 r=-1,完全负相关,回归分析和相关分析的区别和联系: 区别:,1.资料要求不同。回归要求依变量y服从正态分布,X是可以控制的。相关则要求两个变量X 和y都服从正态分布,有两个回归方程。 2.回归反映两个变量之间的单向关系,相关表示两个变量之间的双向关系。 3.回归系数可以是如何实数,有单位;而相关系数在-1,1内取值,无单位。,联系:,1.方向一致。 两者的符号是一致的。r为正时,说明两个变量的相关关系时同向变化的;b为正时,说明两个变量之间由回归方程所确定的函数关系是递增的。 2.假设检验等价。可以互相替代。,3.相关和回归可以互相解释。 当SS总不变的情况下,回归平方和的大小决定了相关系数的大小, r2则可以反映回归平方和在总平方和中所占的比重。回归平方和接近总平方和时, r2接近1,回归效果好。同时也可以从回归的角度对相关程度做进一步的解释。如r=0.5, r2=0.25,说明一个变量y的总变异能够通过x变量以直线回归的关系来估计的比重只占25%,其余75%的变异无法借助直线回归来估计,从而说明两变量间的相关关系实际意义不大。,直线回归和相关的应用要点:,1.要由学科专业知识作指导。是否发生相关以及在什么条件下发生什么相关等问题,都必须由各具体学科本身来决定。否则毫无意义。如孩子的身高与植物的株高的关系,理论上也可以计算出显著水平的相关系数。 2.要严格控制研究对象(x和y)以外的有关因素。否则会产生虚假的结论。如研究密度与产量的关系。肥水、病虫和管理也会影响。 3.分析结果不显著,并不意味x和y没有关系。只能说明两者没有显著的直线关系,也可能存在曲线关系的可能性。,4.一个显著的r或b并不代表X和Y的关系一定是线性的,并不排斥有更好描述X和Y关系曲线的存在。可能就某一区段来讲有极显著的直线关系。 5.在农学和生物研究过程中,发现X和Y关系真实曲线是很难的。只能就某一区段来研究。外推是危险的。 6.一个显著的相关或回归并不一定有实践上的预测意义,有时候不可靠。需要预测时,r的绝对值必须在0.7以上。 7.为了提高分析的准确性,两变数的样本容量n5.,

    注意事项

    本文(8-直线回归与相关13-.ppt)为本站会员(本田雅阁)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    经营许可证编号:宁ICP备18001539号-1

    三一文库
    收起
    展开