第八章多重共线性.ppt
《第八章多重共线性.ppt》由会员分享,可在线阅读,更多相关《第八章多重共线性.ppt(39页珍藏版)》请在三一文库上搜索。
1、第八章 多重共线性,多重共线性,多重共线性及其影响 多重共线性的发现和检验 多重共线性的克服和处理,引子: 发展农业和建筑业会减少财政收入吗?,为了分析各主要因素对财政收入的影响,建立财政收 入模型: 其中: CS财政收入(亿元) ; NZ农业增加值(亿元); GZ工业增加值(亿元); JZZ建筑业增加值(亿元); TPOP总人口(万人); CUM最终消费(亿元); SZM受灾面积(万公顷) 数据样本时期1978年-2003年(资料来源:中国统计年鉴2004,中国统计出版社2004年版),财政收入模型的EViews估计结果,可决系数为0.995,校正的可决系数为0.993,模型拟合很好。模型对
2、财政收入的解释程度高达99.5%。 F统计量为632.10,说明0.05水平下回归方程整体上显著。 t 检验结果表明,除了工业增加值和总人口以外,其他因素对财政收入的影响均不显著。 农业增加值和建筑业增加值的回归系数是负数。 农业和建筑业的发展反而会使财政收入减少吗?! 这样的异常结果显然与理论分析和实践经验不相符。 若模型设定和数据真实性没问题,问题出在哪里呢?,模型估计与检验结果分析,一、多重共线性及其分类,多重共线性及其分类 完全多重共线性 近似多重共线性,多重共线性的概念,对于模型 Yi=0+1X1i+2X2i+kXki+i i=1,2,n 其基本假设之一是解释变量是互相独立的。,如果
3、某两个或多个解释变量之间出现了相关性,则称为多重共线性(Multicollinearity)。,如果存在 c1X1i+c2X2i+ckXki=0 i=1,2,n 其中: ci不全为0,则称为解释变量间存在完全共线性(perfect multicollinearity)。,如果存在 c1X1i+c2X2i+ckXki+vi=0 i=1,2,n 其中ci不全为0,vi为随机误差项,则称为 近似共线性(approximate multicollinearity)或交互相关(intercorrelated)。,注意: 完全共线性的情况并不多见,一般出现的是在一定程度上的共线性,即近似共线性。 但无论是
4、解释变量之间严格的线性关系还是较严重的近似线性关系,都会给多元线性回归分析造成严重的不利影响,甚至导致回归模型完全失效。,(一)多重共线性的理论后果,OLS估计量仍保持BLUE性质(高斯-马尔科夫定理仍然成立) 完全多重共线性导致参数的OLS估计量无法求出(也可以理解为方差无穷大)。 近似多重共线性导致参数的OLS估计量的方差大幅提高,二、 多重共线性的后果,1.虽是线性无偏且最小方差,但其方差是一个非常大的数值,故其估计的精度下降;,2.回归系数的置信区间加宽,导致接受零假设的可能性增大,从而t 检验失效,3. R2 可能很大,F统计值也很高;,4.最小二乘估计量及其标准差都对数据的微小变化
5、非常敏感; 5、模型预测置信区间加宽,预测方差加大,以至失去预测的意义,(二)多重共线性的实际后果 (理论后果的具体表现 ),二、 多重共线性的后果,完全多重共线性及其危害,严格多重共线性不是由于数据原因引起,通常是由于模型把有严格联系的变量引进同一个模型,或者由于虚拟变量设置不当(如陷入虚拟变量陷阱的情况)而引起的。 对模型 的最小二乘估计量为 如果存在完全共线性,则 不存在,无法得到参数的估计量。,以三变量回归模型为例: 回归方程为:,则求参数最小二乘估计量的正规方程组为:,设 和 两个变量之间有严格的线性关系 则 也成立,把该关系式代入上述正规方程组中的第二个式子,可得,很显然,这个方程
6、和原正规方程组中的第一个式子相同,这时方程组不再只有一组解而有无穷组解,这就意味着,被解释变量究竟受哪些变量的影响无法识别。完全多重共线性使多元线性回归模型的参数估计失败,回归分析无法进行。,完全多重共线性是由于在模型设定时把严格联系的变量引进同一个模型,或者是由于虚拟变量设置不当引起的。 因此对完全共线性的处理比较简单,只需要针对性的修改模型,放弃和调整引起完全共线性的部分变量即可。注意,不能放弃形成线性关系的所有解释变量,否则造成解释变量缺落,使模型失去研究意义。,近似多重共线性的原因,近似多重共线性既与变量选择有关,也与数据有关。虽然由于解释变量的选择不当,把内在相关性较强的变量引进同一
7、个模型,是导致近似多重共线性的重要原因,但近似多重共线性更经常的原因是经济数据的共同趋势。 如:时间序列样本:经济繁荣时期,各基本经济变量(收入、消费、投资、价格)都趋于增长;衰退时期,又同时趋于下降。 横截面数据:生产函数中,资本投入与劳动力投入往往出现高度相关情况,大企业二者都大,小企业都小。,近似多重共线性的影响,近似多重共线性不会导致参数估计失效,最小二乘参数估计能够得到唯一解。在模型存在多重共线性的情况下,参数的最小二乘估计仍然是最小方差线性无偏估计。但参数估计量的方差的绝对水平会随着多重共线性程度的提高急剧上升。因此,强的近似多重共线性会对多元回归的有效性产生严重的不利影响。 如果
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 多重 线性
链接地址:https://www.31doc.com/p-2981132.html