一元回归.ppt
《一元回归.ppt》由会员分享,可在线阅读,更多相关《一元回归.ppt(59页珍藏版)》请在三一文库上搜索。
1、1,本章教学目标: 了解回归分析在经济与管理中的广泛应用; 掌握回归分析的基本概念、基本原理及其分析应用的基本步骤; 熟练掌握使用软件求解回归方程及其运行输出结果的分析与使用; 能应用回归分析方法解决实际问题(分析各种变量间的关系,进行预测和控制),第11章 一元回归,2,本章主要内容:,11.1 回归分析概述 11.2 一元线性回归 11.3 质量控制应用案例分析 11.4 残差分析 11.5 曲线回归 本章内容重点: 最小二乘法的原理;回归方程和回归系数的显著性检验;软件的求解分析。,3,在经济管理和其他领域中,人们经常需要研究两个或多个变量(现象)之间的相互(因果)关系,并使用数学模型来
2、加以描述和解释。如: 商品销售量与价格间的关系; 产品的某些质量指标与某些控制因素之间的关系; 家庭消费支出与家庭收入间的关系等等。 回归分析就是对变量间存在的不确定关系进行分析的统计方法。 回归分析是使用得最为广泛的统计学分支,在质量管理、市场营销、宏观经济管理等领域都有非常广泛的应用。,11.1 回归分析概述,4,某钢厂生产的某种合金钢有两个重要的质量指标:抗拉强度(kg/mm2)和延伸率(%)。 该合金钢的质量标准要求:抗拉强度应大于32kg/mm2;延伸率应大于33%。 根据冶金学的专业知识和实践经验,该合金钢的含碳量是影响抗拉强度和延伸率的主要因素。其中含碳量高,则抗拉强度也就会相应
3、提高,但与此同时延伸率则会降低。 为降低生产成本,提高产品质量和竞争能力,该厂质量控制部门要求该种合金钢产品的上述两项质量指标的合格率都应达到99%以上。,质量控制应用案例,5,为达到以上质量控制要求,就需要制定该合金钢冶炼中含碳量的工艺控制标准,也即要确定在冶炼中应将含碳量控制在什么范围内,可以有99%的把握使抗拉强度和延伸率这两项指标都达到要求。 这是一个典型的产品质量控制问题,可以使用回归分析方法求解。,如何制订含碳量的控制标准?,6,1. 确定性关系 也即函数关系,即 Y = f(X) ; Y = (X1, X2, , Xp) 或 F(X, Y) = 0; F(X1, X2, , Xp
4、, Y) = 0 例:价格不变时商品销售收入与销售量的关系。,Y = cX,X,销售收入,Y,销售量,O,Y 与 X 间的确定性关系,一. 变量间的两类关系,7,家庭收入,非确定性关系,O,家庭消费支出, = b0 + b1X,2. 非确定性关系,指变量间虽存在着相互影响和相互制约关系,,但由于许多无法预计和控制的因素的影响,,使变量间,的关系呈现不确定性。,即不能由一个或若干变量的值,精确地确定另一变量的值。,但通过大量观察,,可以发现非确定性关系的变量间,存在着某种统计规律性,称为相关关系或回归关系。,8,以三口之家为单位,某种食品在某年各月的家庭平均月消费量 Y (kg)与其价格 X (
5、元/kg) 间的调查数据如下,试分析该食品家庭平均月消费量与价格间的关系。,【案例1】商品价格与消费量的关系,9,由图可知,该食品家庭月平均消费量 Y 与价格 X 间基本呈线性关系。这些点与直线 Y = 0 + 1X 间的偏差是由其他一些无法控制的因素和观察误差引起的。 因此可以建立 Y 与 X 之间关系的如下线性回归模型 Y = 0 + 1X + (11.1-1) 其中 X 解释变量(自变量) Y 被解释变量(因变量) 0, 1 模型中的未知参数 随机误差项,二. 线性回归模型,10,随机误差项产生的原因,(1) 模型中忽略的其他因素对 Y 的影响; (2) 模型不准确所产生的偏差; (3)
6、 模型中包含了对 Y 无显著影响的变量; (4) 对变量的观察误差; (5) 其他随机因素的影响。,11,线性回归模型的数据结构,yi = 0 + 1xi + i ; i =1, 2, , N (11.1-2) 其中 i 是其他因素和试验误差对 yi 影响的总和。,当 X 取不完全相同的值 x1, x2, , xN 时,,得,到 Y 的一组相应的观察值 y1, y2, , yN 。,显然,,每一对观察值 (xi, yi) 都应满足(11.1-1)式。,因此,一元线性回归模型有如下的数据结构:,12,例 解释截距和斜率一名统计学教授打算运用学生为准备期末考试而学习统计学的小时数(X)预测其期末考
7、试成绩(Y)。依据上学期上课班级中收集的数据建立的回归模型如下: 如何解释截距和斜率? 解 截距=35.0表示当学生不为期末考试做准备的话,期末考试平均成绩是35.0。斜率=3表示每增加1小时学习时间,期末考试平均成绩就变化+3.0。换句话说,每增加1小时学习时间,期末成绩就增加3.0。,13,1. 各 i N( 0, 2 ),且相互独立; 2. 解释变量是可以精确观察的普通变量(非随机变量); 3. 解释变量与随机误差项是各自独立对被解释变量产生影响的。 称满足以上条件的回归模型为经典回归模型。 本章仅讨论经典回归模型。 但在经济领域中,经济变量间的关系通常是不会完全满足上述条件的。 例如家
8、庭消费支出 Y 与家庭收入 X 间的回归模型就不会是同方差的。,三. 回归模型的经典假设条件,14,1. 根据问题的实际背景、专业知识或通过对样本数据的分析,建立描述变量间相关关系的回归模型; 2. 利用样本数据估计模型中的未知参数,得到回归方程; 3. 对模型进行检验; 4. 利用通过检验的回归方程对被解释变量进行预测或控制。,四. 回归分析的主要内容和分析步骤,15,一. 一元线性回归模型 设被解释变量 Y 与 解释变量 X 间存在线形相关关系,则 Y = 0 + 1X + ; N(0, 2 ) (11.2-1) 其中 X 是普通变量。 则 Y N( 0+ 1X, 2 ) 称 Y 的条件期
9、望 E( Y|X ) = 0 + 1X 为 Y 对 X 的回归。,11.2 一元线性回归,16,分别是参数 0 和 1 的点估计,,二. 回归方程,对每一 xi 值,由回归方程可以确定一个回归值,回归系数。,称(11.2-2) 式为回归方程。,记,为 Y 的条件期望 E( Y|X ) 的点估计,,则由(11.2-1),式,,有,(11.2-2),并称,为回归方程的,并记,17,就可求出,三. 回归模型的参数估计,回归模型中的参数估计,,采用的是“最小二乘法”,,其原理如下:,Y 的各观察值 yi 与回归值,之差,反映了 yi,与回归直线之间的偏离程度,,从而全部观察值与回归值,的残差平方和,反
10、映了全部观察值与回归直线间总的偏离程度。,显然,,Q 的值越小,,就说明回归直线对所有样本数据的,拟和程度越好。,所谓最小二乘法,,就是要使,为最小。,只要令,18,yi,要找一条直线,使,xi,最小二乘法原理示意图,19,分别是参数 0 和 1 的最小方差无偏估计。,可以证明,,以上两式说明,,的方差分别为:,2.,四. 最小二乘估计的性质,在满足经典假设的条件下,1,回归系数,的估计精度不仅,与 2 及样本容量 N 有关,,而且与各 xi 取值的分散程,度有关。,在给定样本容量下,,xi 的取值越分散,,则估,计的方差就越小,,即对参数 0 和 1 的估计就越精确;,反之估计的精确就差。,
11、了解这一点,,对指导试验或抽样调查是非常重要的。,20,通过参数估计得到回归方程后,还需要对回归方程进行检验,以确定变量间是否存在显著的线性关系。 对一元线性回归模型,如果变量 Y 与 X 之间并不存在线性相关关系,则模型中的一次项系数 1 应为 0;反之,则 10。 故对一元线性回归模型,要检验的原假设为 H0:1 = 0 以上检验称为对回归方程的显著性检验,使用的仍然是方差分析方法。 Y 的观察值 y1, y2, , yN 之间的差异是由两方面的原因引起的: (1) 解释变量 X 的取值 xi 不同; (2) 其他因素和试验误差的影响。,五. 回归方程的显著性检验,21,为检验以上两方面中
12、哪一个对 Y 取值的影响是主要的, 就需要将它们各自对 Y 取值的影响,从 yi 总的差异中分解出来。 与方差分析类似地,可以用总的偏差平方和,来表示全部观察值 yi 间总的差异量。,1. 偏差平方和的分解,将 ST 作如下分解:,称 SR 为回归平方和,,它主要是由于变量 X 的取值不同,引起的,,其大小反映了 X 的对 Y 影响的重要程度。,称 SE 为剩余平方和或残差平方和,,它主要是由随机误,差和其他因素的影响所引起的。,22,可以证明,,因此,在给定显著性水平 下,若 F F (1, N-2), F(1, N-2),2. 检验H0 的统计量,当 H0 为真时,,统计量,就拒绝 H0,
13、,并称回归方程是显著的,,可以用回归方程对,被解释变量进行预测或控制分析;,反之,,则称回归方程,无显著意义。,若不能拒绝 H0,,则可能有以下原因:,(1) Y 和 X 之间不是线性关系;,(2) 模型中忽略了对 Y 有重要影响的其他因素;,(3) Y 和 X 基本无关;,(4) 数据误差过大。,23,回归方程的显著性检验过程同样可以列成如下方差分析表: 方差分析表,3.方差分析表,24,【案例1】商品价格与消费量的关系,以三口之家为单位,某种食品在某年各月的家庭平均月消费量 Y (kg)与其价格 X (元/kg) 间的调查数据如下,试分析该食品家庭平均月消费量与价格间的关系。,25,可用
14、Excel 【工具】“数据分析”“回归”求解线性回归问题。本案例可解得,“Significance F”为达到的显著性水平,含义与 P-value 相同。 Significance F = 0.00032 0.001 故回归方程是极高度显著的。,方差分析表,故所求回归方程为:,案例1 求解分析,说明该食品价格每上涨一元,,家庭月平均消费量将下降,0.34kg,,kg 为该食品的最大月平均消费量。,26,运用回归分析,可能存在如下一些错误: 不注意最小二乘回归的假设条件 不知道如何评估最小二乘回归的假设条件 不知道在违背某一假设条件的情况下运用除最小二乘回归外的其它方法 在对主要问题不了解的情况
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 一元 回归
链接地址:https://www.31doc.com/p-2652226.html