第十二章线性回归分析.ppt
《第十二章线性回归分析.ppt》由会员分享,可在线阅读,更多相关《第十二章线性回归分析.ppt(70页珍藏版)》请在三一文库上搜索。
1、第十二章 线性回归分析,授课教师:杨卫华 博士,主要内容,1 一元线性回归的基本思路和步骤 2 多元线性回归 3 SPSS的线性回归操作,第一节 一元线性回归,什么是回归分析? (Regression),从样本数据出发,确定变量的数学关系式; 对关系式的可信程度进行统计检验,找到影响某一特定变量显著因素; 根据变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度;,回归分析的一般步骤,重点内容,一元线性回归,涉及一个自变量的回归; 因变量y与自变量x之间为线性关系; 因变量(dependent variable):被预测或被解释的变量,用y表示。 自变量(independ
2、ent variable):预测或解释因变量的一个或多个变量,用x表示 。 因变量与自变量之间的关系用一条线性方程来表示;,一元回归的例子,人均收入是否会显著影响人均食品消费支出; 贷款余额是否会影响到不良贷款; 航班正点率是否对顾客投诉次数有显著影响; 广告费用支出是否对销售额有显著影响;,一元线性回归模型,描述因变量 y 如何依赖于自变量 x 和误差项 的方程称为回归模型 一元线性回归模型: y = b0 + b1 x + e y 是 x 的线性函数(部分)加上误差项 线性部分反映了由于 x 的变化引起的 y 的变化 误差项 是随机变量 反映了除 x 和 y 之间线性关系之外的随机因素对
3、y 的影响 是不能由 x 和 y 之间的线性关系所解释的变异性 0 和 1 称为模型的参数,一元线性回归模型 (基本假定),误差项是期望值为0的随机变量,即E()=0。 对于一个给定的 x 值,y 的期望值为 E ( y ) = 0+ 1 x 对于所有的 x 值,的方差2 都相同 误差项协方差等于零,即i和j相互独立(ij); 误差项是服从正态分布的随机变量。即N( 0 ,2 ),回归方程 (regression equation),描述 y 的平均值或期望值如何依赖于 x 的方程称为回归方程; 一元线性回归方程的形式如下: E( y ) = 0+ 1 x,方程表示一条直线,也称为直线回归方程
4、; 0是回归直线在 y 轴上的截距,是当 x=0 时 y 的期望值; 1是直线的斜率,称为回归系数,表示当 x 每变动一个单位时,y 的平均变动值;,估计的回归方程 (estimated regression equation),一元线性回归中估计的回归方程为:,用样本统计量 和 代替回归方程中的未知参数 和 ,就得到了估计的回归方程;,总体回归参数 和 是未知的,必须利用样本数据去估计;,其中: 是估计的回归直线在 y 轴上的截距, 是直线的斜率,它表示对于一个给定的 x 的值, 是 y 的估计值,也表示 x 每变动一个单位时, y 的平均变动值 。,普通最小二乘法估计 (OLS:Ordin
5、ary Least Square),使因变量的观察值与估计值之间的离差平方和达到最小来求得 和 的方法。即,用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小,最小二乘估计 (图示),最小二乘法 ( 和 的计算公式), 根据最小二乘法的要求,可得求解 和 的公式如下,一元回归方程 统计检验的主要内容,变差,因变量 y 取值的波动称为变差 变差来源于两个方面: 由于自变量 x 的取值不同造成; 除 x 以外的其他因素(如测量误差等)的影响; 对一个具体的观测值来说,变差的大小可以通过该实际观测值与其均值之差 来表示。,变差的分解 (图示),离差平方和的分解 (三个平方
6、和的意义),总平方和(SST) 反映因变量的 n 个观察值与其均值的总离差; 回归平方和(SSR) 反映自变量 x 的变化对因变量 y 取值变化的影响,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和; 残差平方和(SSE) 反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和;,离差平方和的分解 (三个平方和的关系),判定系数R2 (coefficient of determination),回归平方和占总离差平方和的比例,反映回归方程的拟合程度; 取值范围在 0 , 1 之间; R2 1,说明回归方程拟合的越好;R20,说明回归方程
7、拟合的越差; 一元线性回归中,判定系数等于y和x相关系数的平方,即R2(r)2;,线性关系的检验,检验所有自变量与因变量之间的线性关系是否显著; 将均方回归 (MSR)同均方残差 (MSE)加以比较,应用F检验来分析二者之间的差别是否显著; 均方回归:回归平方和SSR除以相应的自由度(自变量的个数K) ; 均方残差:残差平方和SSE除以相应的自由度(n-k-1)。,线性关系的检验 (检验的步骤),提出假设 H0:1=0 所有回归系数与零无显著差异,y与全体x的线性关系不显著,计算检验统计量F,确定显著性水平,并根据分子自由度1和分母自由度n-2找出临界值F 作出决策:若FF ,拒绝H0;若FF
8、 ,不能拒绝H0,线性关系的检验 (sig值检验),Sig值小于显著性水平a,拒绝零假设 认为所有回归系数与零存在显著差异,被解释变量y与解释变量x的线性关系显著,可以用线性模型描述它们之间的关系; Sig值大于显著性水平a,不应拒绝零假设 说明用线性模型描述x和y之间的关系是不恰当的。,检验回归方程中的每个解释变量x与被解释变量y之间是否存在显著的线性关系; 确定解释变量能否保留在线性回归方程中。,回归系数的显著性检验,回归系数的检验 (样本统计量 的分布),是根据最小二乘法求出的样本统计量,服从正态分布; 的分布具有如下性质 数学期望: 标准差: 由于未知,需用其估计量se来代替得到 的估
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十二 线性 回归 分析
链接地址:https://www.31doc.com/p-2969826.html