欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 研究报告>
  • 工作总结>
  • 合同范本>
  • 心得体会>
  • 工作报告>
  • 党团相关>
  • 幼儿/小学教育>
  • 高等教育>
  • 经济/贸易/财会>
  • 建筑/环境>
  • 金融/证券>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > DOC文档下载
     

    第七章相关与回归分析.doc

    • 资源ID:2715193       资源大小:710.54KB        全文页数:20页
    • 资源格式: DOC        下载积分:4
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录   微博登录  
    二维码
    微信扫一扫登录
    下载资源需要4
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第七章相关与回归分析.doc

    第七章 相关与回归分析一、本章学习要点(一)相关分析就是研究两个或两个以上变量之间相关程度大小以及用一定函数来表达现象相互关系的方法。现象之间的相互关系可以分为两种,一种是函数关系,一种是相关关系。函数关系是一种完全确定性的依存关系,相关关系是一种不完全确定的依存关系。相关关系是相关分析的研究对象,而函数关系则是相关分析的工具。相关按其程度不同,可分为完全相关、不完全相关和不相关。其中不完全相关关系是相关分析的主要对象;相关按方向不同,可分为正相关和负相关;相关按其形式不同,可分为线性相关和非线性相关;相关按影响因素多少不同,可分为单相关和复相关。(二)判断现象之间是否存在相关关系及其程度,可以根据对客观现象的定性认识作出,也可以通过编制相关表、绘制相关图的方式来作出,而最精确的方式是计算相关系数。相关系数是测定变量之间相关密切程度和相关方向的代表性指标。相关系数用符号“”表示,其特点表现在:参与相关分析的两个变量是对等的,不分自变量和因变量,因此相关系数只有一个;相关系数有正负号反映相关系数的方向,正号反映正相关,负号反映负相关;计算相关系数的两个变量都是随机变量。相关系数的取值区间是1,1,不同取值有不同的含义。当时,与的变量为完全相关,即函数关系;当时,表示与存在一定的线性相关,的数值越大,越接近于1,表示相关程度越高;反之,越接近于0,相关程度越低,通常判别标准是:称为微弱相关,称为低度相关,称为显著相关,称为高度相关;当时,表示的变化与x无关,即不相关;当时,表示与为线性正相关,当时,表示与为线性负相关。皮尔逊积距相关系数计算的基本公式是: 斯皮尔曼等级相关系数和肯特尔等级相关系数是测量两个等级变量(定序测度)之间相关密切程度的常用指标。(三)回归分析是对具有相关关系的两个或两个以上变量之间数量变化的一般关系进行测定,确定一个相应的数学表达式,以便从一个已知量来推测另一个未知量,为估计预测提供一个重要的方法。回归分析按自变量的个数分,有一元回归和多元回归,按回归线的形状分,有线性回归和非线性回归。与相关分析相比,回归分析的特点是:两个变量是不对等的,必须区分自变量和因变量;因变量是随机的,自变量是可以控制的量;对于一个没有因果关系的两变量,可以求得两个回归方程,一个是倚的回归方程,一个是倚的回归方程。简单线性回归方程式为:,式中是的估计值,代表直线在轴上的截距,表示直线的斜率,又称为回归系数。回归系数的涵义是,当自变量每增加一个单位时,因变量的平均增加值。当的符号为正时,表示两个变量是正相关,当的符号为负时,表示两个变量是负相关。、都是待定参数,可以用最小平方法求得。求解、的公式为:; 回归估计标准误差是衡量因变量的估计值与观测值之间的平均误差大小的指标。利用此指标可以说明回归方程的代表性。其计算公式为: 或回归估计标准误和相关系数之间具有以下关系: 相关系数与回归系数之间具有以下的关系: 二、本章思考题及练习题(一) 填空题1、 在相关关系中,把具有因果关系相互联系的两个变量中起影响作用的变量称为_,把另一个说明观察结果的变量称为_。2、 现象之间的相关关系按相关的程度分有_相关、_相关和_相关;按相关的方向分有_相关和_相关;按相关的形式分有_相关和_相关;按影响因素的多少分有_相关和_相关。3、 对现象之间变量关系的研究中,对于变量之间相互关系密切程度的研究,称为_;研究变量之间关系的方程式,根据给定的变量数值以推断另一变量的可能值,则称为_。4、 完全相关即是_关系,其相关系数为_。5、 在相关分析中,要求两个变量都是_;在回归分析中,要求自变量是_,因变量是_。6、 相关系数是在_相关条件下用来说明两个变量相关_的统计分析指标。7、 相关系数的变动范围介于_与_之间,其绝对值愈接近于_,两个变量之间线性相关程度愈高;愈接近于_,两个变量之间线性相关程度愈低。当_时表示两变量正相关;_时表示两变量负相关。8、 当变量值增加,变量值也增加,这是_相关关系;当变量值减少,变量值也减少,这是_相关关系。9、 在判断现象之间的相关关系紧密程度时,主要用_进行一般性判断,用_进行数量上的说明。10、 在回归分析中,两变量不是对等的关系,其中因变量是_变量,自变量是_量。11、 已知,那么,和的相关系数是_。12、 用来说明回归方程代表性大小的统计分析指标是_指标。13、 已知,那么变量和的相关系数是_。14、 回归方程中的参数是_,估计特定参数常用的方法是_。15、 若商品销售额和零售价格的相关系数为-0.95,商品销售额和居民人均收入的相关系数为0.85,据此可以认为,销售额对零售价格具有_相关关系,销售额与人均收入具有_相关关系,且前者的相关程度_后者的相关程度。16、 当变量按一定数额变动时,变量也按一定数额变动,这时变量与之间存在着_关系。17、 在直线回归分析中,因变量的总变差可以分解为_和_,用公式表示,即_。18、 一个回归方程只能作一种推算,即给出_的数值,估计_的可能值。19、 如估计标准误差愈小,则根据回归直线方程计算的估计值就_20、 已知直线回归方程中,;又知,则可知。21、 已知回归直线斜率为0.8,自变量的方差是200,样本容量为20,那么回归平方和是_。22、 已知变量倚变量的直线回归方程的斜率为,又知变量和之间的相关系数,那么,变量倚的直线回归方程斜率是_。(二) 单项选择题1、当自变量的数值确定后,因变量的数值也随之完全确定,这种关系属于( )A、相关关系 B、函数关系C、回归关系 D、随机关系2、测定变量之间相关密切程度的代表性指标是( )A、估计标准误 B、两个变量的协方差C、相关系数 D、两个变量的标准差3、现象之间的相互关系可以归纳为两种类型,即( )A、相关关系和函数关系 B、相关关系和因果关系C、相关关系和随机关系 D、函数关系和因果关系4、相关系数的取值范围是( )A、 B、C、 D、5、变量之间的相关程度越低,则相关系数的数值( )A、越小 B、越接近于0C、越接近于-1 D、越接近于16、在价格不变的条件下,商品销售额和销售量之间存在着( )A、不完全的依存关系 B、不完全的随机关系C、完全的随机关系 D、完全的依存关系7、下列哪两个变量之间的相关程度高( )A、商品销售额和商品销售量的相关系数是0.9;B、商品销售额与商业利润率的相关系数是0.84;C、平均流通费用率与商业利润率的相关系数是-0.94;D、商品销售价格与销售量的相关系数是-0.918、回归分析中的两个变量( )A、都是随机变量 B、关系是对等的C、都是给定的量 D、一个是自变量,一个是因变量9、每一吨铸铁成本(元)倚铸件废品率(%)变动的回归方程为:,这意味着( )A、 废品率每增加1%,成本每吨增加64元B、 废品率每增加1%,成本每吨增加8%C、 废品率每增加1%,成本每吨增加8元D、 如果废品率增加1%,则每吨成本为56元。10、某校对学生的考试成绩和学习时间的关系进行测定,建立了考试成绩倚学习时间的直线回归方程为:,该方程明显有错,错误在于( )A、a值的计算有误,b值是对的B、b值的计算有误,a值是对的C、a值和b值的计算都有误D、自变量和因变量的关系搞错了11、配合回归方程对资料的要求是( )A、因变量是给定的数值,自变量是随机的B、自变量是给定的数值,因变量是随机的C、自变量和因变量都是随机的D、自变量和因变量都不是随机的。12、估计标准误说明回归直线的代表性,因此( )A、估计标准误数值越大,说明回归直线的代表性越大;B、估计标准误数值越大,说明回归直线的代表性越小;C、估计标准误数值越小,说明回归直线的代表性越小;E、 估计标准误数值越小,说明回归直线的实用价值越小。13、在相关分析中,要求相关的两个变量( )A、都是随机变量 B、都不是随机变量C、其中因变量是随机变量 D、其中自变量是随机变量14、在简单回归直线中,表示( )A、当增加一个单位时,增加的数量B、当增加一个单位时,增加的数量C、当增加一个单位时,的平均增加值D、当增加一个单位时,的平均增加值15、相关关系是( )A、现象之间,客观存在的依存关系B、现象之间客观存在的,关系数值是固定的依存关系C、现象之间客观存在的,关系数值不固定的依存关系D、函数关系16、判断现象之间相关关系密切程度的主要方法是( )A、对客观现象作定性分析 B、编制相关表C、绘制相关图 D、计算相关系数17、当变量按一定数额变化时,变量也随之近似地按固定的数额变化,那么,这时变量和之间存在着( )A、正相关关系 B、负相关关系C、直线相关关系 D、曲线相关关系18、两个变量间的相关关系称为( )A、单相关 B、无相关C、复相关 D、多相关19、如果两个变量之间的相关系数,说明这两个变量之间存在( )。A、低度相关关系 B、高度相关关系C、完全相关关系 D、显著相关关系20、已知,则相关系数=( )A、0.925 B、-0.913 C、0.957 D、0.91321、已知是的两倍,并已知是的1.2倍,则相关系数为( )A、不能计算B、0.6C、1.2/D、/222、不计算相关系数,是否也能计算判断两个变量之间相关关系的密切程度( )A、能够 B、不能够C、有时能够,有时不能D、能判断但不能计算出具体数值23、每吨铸件的成本(元)与每一个工人劳动生产率(吨)之间的回归方程为,这意味着劳动生产率每提高一个单位(吨)成本就( )A、提高270元 B、提高269.5元C、降低0.5元 D、提高0.5元24、已知变量的标准差,变量的标准差为;并且已知,则相关系数为( )A、不可知 B、1/2 C、 D、25、已知某工厂甲产品产量和生产成本有直线关系,在这条直线上,当产量为1000时,其生产成本为30000元,其中不随产量变化的成本为6000元,则成本总额对产量的回归方程是( )A、 B、C、 D、26、回归估计的估计标准误差的计算单位与( )A、自变量相同 B、因变量相同C、自变量及因变量相同 D、相关系数相同27、计算回归估计标准误的依据是( )A、因变量数列与自变量数列B、因变量的总离差C、因变量的回归离差D、因变量的剩余离差28、回归估计标准误是反映( )A、平均数代表性的指标B、序时平均数代表性的指标C、现象之间相关关系的指标D、回归直线代表性的指标29、当两个相关变量之间只能配合一条回归直线时,那么这两个变量之间的关系( )A、存在明显因果关系B、不存在明显因果关系而存在相互联系C、存在自身相关关系D、存在完全相关关系(三) 多项选择题1、测定现象之间有无相关关系的方法是( )A、编制相关表 B、绘制相关图C、对客观现象做定性分析 D、计算估计标准误E、配合回归方程2、直线回归分析中( )A、自变量是可控制量,因变量是随机的B、两个变量不是对等的关系C、利用一个回归方程,两个变量可以互相推算D、根据回归系数可判定相关的方向E、对于没有明显因果关系的两变量可求得两个回归方程3、下列属于正相关的现象是( )A、家庭收入越多,其消费指出也越多;B、某产品产量随工人劳动生产率的提高而增加;C、流通费用率随商品销售额的增加而减少;D、生产单位产品所耗工时随劳动生产率的提高而减少;E、产品产量随生产用固定资产价值的减少而减少。4、直线回归方程中的称为回归系数,回归系数的作用是( )A、可确定两变量之间因果的数量关系B、可确定两变量的相关方向C、可确定两变量相关的密切程度D、可确定因变量的实际值与估计值的变异程度E、可确定当自变量增加一个单位时,因变量的平均增加值5、计算相关系数时( )A、 相关的两个变量是对等的关系B、 相关的两个变量一个是随机的,一个是可控制的量C、 相关系数有正负号,可判断相关的方向D、 可以计算出自变量和因变量两个相关系数E、相关的两个变量都是随机的6、可用来判断现象之间相关方向的指标有( )A、估计标准误 B、相关系数C、回归系数 D、两个变量的协方差E、两个变量的标准差7、工人的工资(元)依劳动生产率(千元)的回归方程为,这意味着( )A、如果劳动生产率等于1000元,则工人工资为70元;B、如果劳动生产率每增加1000元,则工人工资平均提高70元;C、如果劳动生产率每增加1000元,则工人工资增加80元;D、如果劳动生产率等于1000元,则工人工资为80元;E、如果劳动生产率每下降1000元,则工人工资平均减少70元。8、在回归分析中,就两个相关变量与而言,变量倚变量的回归和变量倚变量的回归所得的两个回归方程是不同的,这种不同表现在( )A、方程中参数估计的方法不同B、方程中参数的数值不同C、参数表示的实际意义不同D、估计标准误的计算方法不同E、估计标准误的数值不同9、回归估计标准误是反映( )A、回归方程代表性大小的指标B、估计值与实际值平均误差程度的指标C、自变量与因变量离差程度的指标D、因变量估计值的可靠程度的指标E、 回归方程实用价值大小的指标10、现象之间相互联系的类型有( )A、函数关系 B、回归关系 C、相关关系D、随机关系 E、结构关系11、相关关系种类( )A、从相关方向分为正相关和负相关B、从相关形态分为线性相关和非线性相关C、从相关程度分为完全相关、不完全相关和零相关D、从相关的影响因素多少可分为单相关和复相关E、从相关数值形式分为相关系数和相关指数12、下列现象属于相关关系的是( )A、家庭收入越多,则消费也增长B、圆的半径越长,则圆的面积越大C、产量越高,总成本越多D、施肥量增加,粮食产量也增加E、体积随温度升高而膨胀,随压力加大而减小13、据统计资料证实,商品流通费用率的高低与商品销售额的多少有依存关系,即随商品销售额的增加,商品流通费用率有逐渐降低的变动趋势,但这种变动不是均等的。可见这种关系是( )A、函数关系 B、相关关系 C、正相关D、负相关 E、曲线相关14、直线回归分析的特点是( )A、两个变量不是对等关系B、回归系数只能取正值C、自变量是给定的,因变量是随机的D、可求出两个回归方程E、利用一个回归方程,两个变量可以相互换算15、配合一条直线回归方程是为了( )A、确定两个变量之间的变动关系B、用因变量推算自变量C、用自变量推算因变量D、两个变量互相推算E、确定两个变量之间的函数关系16、直线相关分析与直线回归分析的区别在于( )A、相关的两个变量都是随机的,而回归分析中自变量是给定的数值,因变量是随机的B、回归分析中的两个变量都是随机的,而相关中的自变量是给定的数值,因变量是随机的C、相关系数有正负号,而回归系数只能取正值D、相关的两个变量是对等关系,而回归分析中的两个变量不是对等关系E、相关分析中根据两个变量只能计算出一个相关系数,而回归分析中根据两个变量可以求出两个回归方程17、相关系数的计算公式有( )A、 B、C、D、 E、18、直线回归方程的意义是( )A、这是一条具有平均意义的直线;B、对应一个确定的所计算出来的是指与对应出现所有的平均数的估计值C、毫无平均的意义D、与一个固定的对应出现的应该等于,如果不等于,说明在观测中出现了误差E、与一个固定的对应出现的落在以为中心的一个多大的范围内取决于概率度和估计标准误差。(四) 判断题1、 根据结果标志对因素标志的不同反映,可以把现象总体数量上的依存关系划分为函数关系和相关关系。( )2、 正相关指的就是因素标志和结果标志的数量变动方向都是上升的。( )3、 相关系数是测定变量之间相关密切程度的唯一方法。( )4、 只有当相关系数接近于+1时,才能说明两变量之间存在高度相关关系。( )5、 若变量x的值减少时变量y的值也减少,说明变量x与y之间存在正的相关关系。( )6、 回归系数b和相关系数都可用来判断现象之间相关的密切程度。( )7、 若直线回归方程,则变量和之间存在负的相关关系。( )8、 按直线回归方程配合的直线,是一条具有平均意义的直线。( )9、 回归分析中,对于没有明显关系的两个变量,可以建立倚变动和倚变动的两个回归方程。10、由变量倚变量回归和由变量倚变量回归所得到的回归方程之所以不同,主要是因为方程中参数表示的意义不同。( )11、在相关分析中,要求两个变量都是随机的,在回归分析中,要求两个变量都不是随机的。( )12、当变量按固定数额增加时,变量按大致固定数额下降,则说明变量之间存在负直线相关关系。( )13、判定系数越大,估计标准误差越大,判定系数越小,估计标准误差越小。( )14、回归估计标准误差的大小与因变量的方差无关。( )15、总变差不一定大于回归变差。( )16、相关系数数值越大,说明相关程度越高;相关系数数值越小,说明相关程度越低。( )17、现象之间的函数关系可以用一个数学表达式反映出来。( )18、利用最小平方法配合的直线回归方程,要求实际测定的所有相关点和直线上的距离平方和为零。()19、不管自变量如何变化,因变量都不变,这种情况称为零相关。()20、在等级相关中,当现象是完全的直线关系时,其差量等于,等级系数等于。()21、产量增加,则单位产品成本降低,这种现象属于函数关系。()22、相关系数等于,说明两变量之间不存在直线相关关系;相关系数等于,说明两变量之间存在完全正相关关系;相关系数等于,说明两变量之间存在完全负相关关系。()23、回归关系要确定变量中哪个是自变量哪个是因变量,在这点上它与相关关系相同。( )24、变量与平均数的离差平方和,即称为的总变差。( )(五) 简答题1、 如何理解自变量和因变量?2、 什么是相关关系?它与函数关系有何不同?3、 怎样判断现象之间有无相关关系?4、 相关分析与回归分析有何区别与联系?5、 相关关系的种类有哪些?6、 说明相关系数的取值范围及其判断标准。7、 时间序列自身相关意义是什么?8、 区别下列现象为相关关系或为函数关系:(1) 物体体积随温度升高而膨胀,随压力加大而收缩。(2) 测量的次数越多,其平均长度愈接近实际长度。(3) 家庭收入越多,其消费支出也有增长的趋势。(4) 秤砣的误差愈大,权衡的误差也愈大。(5) 物价愈上涨,商品的需求量愈小。(6) 文化程度愈高,人口的平均寿命也愈长。(7) 圆的半径愈长,圆周也愈长。(8) 农作物的收获量和雨量、气温、施肥量有密切的关系。9、 等级相关的意义是什么?如何测定等级相关?10、拟合回归方程有什么要求?回归方程中参数、的经济含义是什么?11、估计标准误与算术平均数的标准差有何异同?12、回归系数和相关系数的关系如何?13、回归分析模型的种类及应用场合。14、什么是估计标准误?这个指标有什么作用? (六) 计算题1、已知12对父子身高资料如下表:父身高(寸)656367646862706668676971子身高(寸)686668656966686571676870要求作出散点图;估计(儿)依(父)的直线回归方程;估计依的直线回归方程;计其父子身高的相关系数。2、有10个同类企业的生产性固定资产年均价值和工业增加值资料如下:企业编号生产性固定资产价值(元)工业增加值(万元)131852429101019320063844098155415913650292873146058121015169102212191012251624合计65259801根据资料:(1)计算相关系数,说明两变量相关的方向和程度; (2)编制直线回归方程,指出方程参数的经济意义; (3)计算估计标准误; (4)估计生产性固定资产(自变量)为1100万元时,工业增加值(因变量)的可能值;3、某地区19932002年个人消费支出和收入资料如下:单位:万元年份个人收入消费支出年份个人收入消费支出1993164156199820718819941701601999225202199517716620002432181996182170200126523619971921782002289255要求:(1)判断两者为何关系,计算两者相关系数;(2)若为直线关系,试利用所给资料建立回归方程;(3)计算回归方程的估计标准误差;(4)若个人收入为300亿元时,试估计个人消费支出额。4、检查五位同学会计学的学习时间与成绩分数如下表所示:学习时数(小时)学习成绩(分)44066075010701390根据资料:(1)建立学习成绩()倚学习时间()的直线回归方程; (2)计算估计标准误; (3)对学习成绩的方差进行分解分析,指出总误差平方和中有多大比重可由回归方程来解释; (4)由此计算出学习时数与学习成绩之间的相关系数。5、根据下列资料求等级相关系数。十种水平消费者平分资料如下:编号甲组平分乙组平分1837828084385844908057975672737778686870970751081736、根据某地区历年人均收入(元)与商品销售额(万元)资料计算的有关数据如下:(代表人均收入,代表销售额) 计算:(1)建立以商品销售额为因变量的直线回归方程,并解释回归系数的含义; (2)若2003年人均收入为400元,试推算该年商品销售额。7、某省粮食产量资料如下,要求计算自身相关系数。年份本年产量(亿公斤)上年产量(亿公斤)1992100199392100199412092199512212019961501221997140150199815014019991551502000160155200116016020021701608、某地经回归分析,其每亩地施肥量()和每亩粮食产量()的回归方程为:,试解释式中回归系数的经济含义。若每亩最高施肥量为40斤,最低施肥量为20斤,问每亩粮食产量的范围为多少?9、试根据下列资料编制直线回归方程和计算直线相关系数:,10、根据某企业产品销售额(万元)和销售利润率(%)资料计算出如下数据: 要求:(1)确定以利润为因变量的直线回归方程。(2)解释式中回归系数的经济含义。(3)当销售额为500万元时,利润率为多少?11、试根据下列资料编制回归方程:,12、某地区家计调查资料得到,每户平均年收入为6800元,均方差为800元,每户平均年消费支出为5200元,方差为40000元,支出对于收入的回归系数为0.2,要求:(1)计算收入与支出的相关系数;(2)拟合支出对于收入的回归方程;(3)估计年收入在7300元时的消费支出额;(4)收入每增加1元,支出平均增加多少元?13、根据下列资料分别计算各小题:(1)已知,试编制直线回归方程。(2)已知,试编制直线回归方程。(3)已知直线回归方程中回归参数为3,两变量的平均数分别为,求直线回归方程。(4)已知,是的5倍,则?(5)已知,两变量,是的2倍,求?14、某部门8个企业产品销售额和销售利润资料如下:企业编号产品销售额销售利润11708.1222012.5339018.0443022.0548026.5665040.0795064.08100069.0 要求:(1)计算产品销售额与利润额的相关系数; (2)建立以利润额为因变量的直线回归方程,说明斜率的经济意义; (3)当企业产品销售额为500万元时,销售利润为多少?15、已知直线回归方程,试求和。16、已知、两变量的相关系数,为的两倍,求依的回归方程。17、某村研究小组在实验田里进行某种粮食作物的施肥试验,考察施肥量与单位面积产量之间的关系。试验时以5块地为一组,实际资料如下表:每亩施肥量(斤)606570758085各块地亩产量(斤/亩)347380401525550800350391428467682720348425466593600740340349450500588800330400410500680700平均亩产343389431517620750要求:绘制散点图,观察亩产量的变动趋势,并判断相关的方向;计算施肥量在6080个区间内亩施肥量与亩产量相关系数,并求出回归方程;估计亩施肥量为85斤时的平均亩产量,并与实际产量比较,说明产生差异的原因(提示:应根据原始资料作,虽当依回归时,用平均亩产量作的回归方程同根据原始资料作出的一样,但因变量的方差不同,从而相关系数、估计标准误差都可能不同)。18、已知、两变量,在直线回归方程中,当自变量等于0时,又已知,试求估计标准误。19、考查某个检验员判别颜色的能力。先用比色方法把深浅程度不同的某种颜色分为10个等级;再由检验员自行判断该10个颜色等级不同的盒子。其结果如下:盒子真实颜色等级为:1,2,3,4,5,6,7,8,9,10;检验员判定的等级,其结果如下:4,7,2,10,3,6,8,1,5,9。问该检验员的判断能力如何?三、习题参考答案选答(一) 填空题2、完全相关、不完全相关、不相关;正相关、负相关;线性相关、非线性相关;单相关、复相关;4、函数、±1;6、线性、密切程度;8、正、正10、随机、可控制的;12、估计标准误;14、回归系数、最小平方法;16、直线相关;18、自变量、因变量;20、240; 22、(二) 单项选择题2、C 4、C 6、D 8、D 10、C 12、B14、C16、D18、A20、B22、D24、A26、B28、D(三) 多项选择题2、ABDE 4、ABE 6、BCD 8、BCE 10、AC12、ACD14、ACD16、ADE18、ABE(四) 判断题2、× 4、× 6、× 8、 10、 12、 14、×16、×18、×20、22、24、(五) 简答题2、答:相关关系是一种不完全确定的随机关系,在相关关系的情况下,因素标志的每个数值都有可能有若干个结果标志的数值与之对应。例如,广告费支出与销售额之间的关系就是一种相关关系,当广告费支出一定的情况下,商品销售额相应的会出现一系列的数值。因此,相关关系是一种不完全的依存关系。相关关系与函数关系的不同表现在:(1)相关关系的两变量的关系值是不确定的,当给出自变量的数值后,因变量可能会围绕其平均数出现若干个数值与之对应;而函数关系的两变量的关系值是完全确定的,即当给出自变量的数值后,因变量只有一个唯一确定的数值与之对应。(2)函数关系变量之间的依存可用方程表现出来,而相关关系则不能,它需要借助于函数关系的数学表达式,才能表现出现象之间的数量联系。4、答:就一般意义而言,相关分析包括回归和相关两方面的内容,因为它们都是研究变量之间相互关系的。但就具体方法所解决的问题而言,回归和相关又有明显的区别,二者的区别主要表现在以下几方面:(1) 进行相关分析时可以不问两个变量的关系是因果关系还是共变关系,不必确定两变量中哪个是自变量哪个是因变量,而回归分析时,则必须事先进行定性分析来确定自变量和因变量。(2) 相关分析中的两变量可以都是随机变量,而回归分析中的两变量只有因变量是随机的,自变量是可以控制的量。(3)计算相关系数的两变量是对等的,改变两者的位置并不影响相关系数的数值,而回归分析中,对于没有明显因果关系的两变量,可以求得两个回归方程,一个为y倚x的回归方程,另一个为x倚y的回归方程。二者的联系主要表现在:回归分析和相关分析是互相补充、密切联系的。相关分析需要回归分析来表明现象数量关系的具体形式,而回归分析则应该建立在相关分析的基础上。依靠相关分析表明现象的数量变化具有密切的相关,进行回归分析求其相关的具体形式才有意义。6、答:相关系数的数值范围是在-1和+1之间,即,为正相关,为负相关。判断标准:为微弱相关,为低度相关; 为显著相关,为高度相关;时,不相关,时完全相关。8、(1)受热温度和物体体积之间是函数关系,因为物体热膨胀系数是一定的。受压力与物体体积也是函数关系,因为物体承压收缩率也是一定的。(2)测量次数与测量误差是相关关系,因为测量次数影响着误差,但其影响值是不固定的。(3)家庭收入与消费支出是相关关系,因为收入影响消费发生,但其影响值不是固定的。(4)秤砣误差与权衡误差是函数关系,因为秤砣误差会引起权衡的偏误,其间关系是固定的。(5)物价与需求量之间是相关关系,物价上涨,一般影响商品需求量降低,但其影响程度不是固定的。(6)文化程度与人口寿命也是相关关系,因为文化程度对人口寿命确实存在影响,但两者并不形成固定的函数关系。(7)圆的半径与圆周的长度是函数关系,因为后者等于前者的6.28倍。(8)农作物收获量和雨量、气温、施肥量都是相关关系,后者各因素对农作物的收获量都发生作用,但它们在数量上没有固定的关系。10、答:一般来讲,拟合回归方程的要求是:找出合适的参数和,使所确定的回归方程能够达到实际的值与对应的理论值的离差平方和为最小值。即:回归方程中参数、的经济含义上:参数代表直线的起点值,在数学上称为直线的纵轴截距,它表示时的常数项。参数称为回归系数,表示自变量增加一个单位时因变量的平均增加值。回归系数的正负号与相关系数是一致的,因此可以从回归系数的正负号来判断两变量相关的方向。12、见本章学习要点中有关内容。14、答:估计标准误是表明回归方程理论值与实际值之间离差的平均水平的指标。此指标的作用有以下几点:(1) 它可以说明以回归直线为中心的所有相关点的离散程度。(2) 它可以说明回归方程的理论值代表相应实际值的代表性大小。(3) 它可以反映两变量之间相关的密切程度。(六) 计算题2、解:(计算过程略)设生产性固定资产为自变量,工业总产值为因变量,所需合计数如下: (1)计算相关系数,说明两变量之间存在高度正相关。(2)编制直线回归方程:求解参数、:回归方程为:(3)计算估计标准误(4)当生产性固定资产万元时,工业总产值为: (万元)4、解:(计算过程略)设学习时间为自变量,学习成绩为因变量,所需合计数如下: (1)编制直线回归方程: 经计算求得: 回归方程为:(2) 计算估计标准误:(3)计算总误差平方和中回归误差所占比重。此比重称为决定系数,用符号表示。(列表计算各项离差过程略) 根据计算得知: 则即总误差中有91.35%可以由回归方程来解释,说明学习时数与学习成绩之间存在高度相关。(4)计算相关系数:6、解:(计算过程略)(1)配合回归方程: 回归方程为:回归系数的含义:当人均收入每增加一元时,商品销售额平均增加0.92万元。(2)预测2003年商品销售额: (万元)8、解:解释回归系数的意义:当施肥量每增加1斤,粮食产量增加10.5斤。确定粮食产量的范围:上限:当时,(斤)下限:当时,(斤)所以:每亩粮食产量范围为:

    注意事项

    本文(第七章相关与回归分析.doc)为本站会员(本田雅阁)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    经营许可证编号:宁ICP备18001539号-1

    三一文库
    收起
    展开