第4部分违背基本假设的情况.ppt
《第4部分违背基本假设的情况.ppt》由会员分享,可在线阅读,更多相关《第4部分违背基本假设的情况.ppt(86页珍藏版)》请在三一文库上搜索。
1、第4章 违背基本假设的情况,4.1 异方差性产生的背景和原因 4.2 一元加权最小二乘估计 4.3 多元加权最小二乘估计 4.4 自相关性问题及其处理 4.5 异常值与强影响点 4.6 本章小结与评注,第四章 违背基本假设的情况,Gauss-Markov条件,4.1 异方差性产生的背景和原因,一、异方差产生的原因 例4.1 居民收入与消费水平有着密切的关系。用xi表示第i户的收入量,yi表示第i户的消费额,一个简单的消费模型为: yi=0+1xi+i,i=1,2,n 低收入的家庭购买差异性比较小, 高收入的家庭购买行为差异就很大。 导致消费模型的随机项i具有不同的方差。,4.1 异方差性产生的
2、背景和原因,二、异方差性带来的问题 当存在异方差时,普通最小二乘估计存在以下问题: (1)参数估计值虽是无偏的,但不是最小方差线性无偏估计; (2)参数的显著性检验失效; (3)回归方程的应用效果极不理想。,4.2 一元加权最小二乘估计,一、异方差性的检验 (一)残差图分析法,图2.5(b) 存在异方差,4.2 一元加权最小二乘估计,一、异方差性的检验 (二)等级相关系数法 等级相关系数检验法又称斯皮尔曼(Spearman)检验,是一种应用较广泛的方法。这种检验方法既可用于大样本,也可用于小样本。进行等级相关系数检验通常有三个步骤。 第一步,作y关于x的普通最小二乘回归,求出ei的估计值,即e
3、i的值。,4.2 一元加权最小二乘估计,(二)等级相关系数法 第二步,取ei的绝对值,分别把xi和|ei|按递增(或递减)的次序分成等级,按下式计算出等级相关系数:,其中,n为样本容量,di为对应于xi和|ei|的等级的差数。,4.2 一元加权最小二乘估计,(二)等级相关系数法 第三步,做等级相关系数的显著性检验。在n8的情况下,用下式对样本等级相关系数rs进行t检验。检验统计量为:,如果tt/2(n-2)可认为异方差性问题不存在, 如果tt/2(n-2),说明xi与|ei|之间存在系统关系,异方差性问题存在。,4.2 一元加权最小二乘估计,例4.3 设某地区的居民收入与储蓄额的历史统计数据如
4、表4.1。 (1)用普通最小二乘法建立储蓄y与居民收入x的回归方程,并画出残差散点图; (2)诊断该问题是否存在异方差;,4.2 一元加权最小二乘估计,4.2 一元加权最小二乘估计,图4.1 残差图,4.2 一元加权最小二乘估计,用SPSS计算等级相关系数。,4.2 一元加权最小二乘估计,(2)计算等级相关系数。,4.2 一元加权最小二乘估计,Spearman等级相关系数可以反映非线性相关的情况, Pearson简单相关系数不能反映非线性相关的情况。 例如x与y的取值如下,,容易计算出y与x的简单相关系数r=0.9746, 而y与x的等级相关系数rs=1,具有完全的曲线相关。,4.2 一元加权
5、最小二乘估计,二、一元加权最小二乘估计,消除异方差性的方法通常有: 加权最小二乘法, Box-Cox变换法, 方差稳定性变换法 加权最小二乘法(Weighted Least Square,简记为WLS)是一种最常用的消除异方差性的方法。,4.2 一元加权最小二乘估计,二、一元加权最小二乘估计,一元线性回归普通最小二乘法的残差平方和为:,一元线性回归的加权最小二乘的离差平方和为:,4.2 一元加权最小二乘估计,加权最小二乘估计为:,其中,,是自变量的加权平均;,是因变量的加权平均。,4.2 一元加权最小二乘估计,观测值的权数应该是观测值误差项方差的倒数,即,在实际问题中,误差项的方差是未知的,常
6、与自变量x的幂函数xm成比例,其中m是待定的未知参数。此时权函数为,4.2 一元加权最小二乘估计,三、寻找最优权函数,利用SPSS软件可以确定幂指数m的最优取值。 依次点选Analyze-Regression-Weight Estimation进入估计权函数对话框,默认的幂指数m的取值为 m=-2.0,-1.5,-1.0,-0.5,0,0.5,1.0,1.5,2.0。 先将因变量y与自变量x选入各自的变量框,再把x选入Weight变量框,幂指数(Power)取默认值,计算结果如下(格式略有变动):,4.2 一元加权最小二乘估计,Log-likelihood Function = -224.25
7、8830 POWER value = -2.000 Log-likelihood Function = -221.515008 POWER value = -1.500 Log-likelihood Function = -218.832193 POWER value = -1.000 Log-likelihood Function = -216.252339 POWER value = -.500 Log-likelihood Function = -213.856272 POWER value = .000 Log-likelihood Function = -211.773375 POW
8、ER value = .500 Log-likelihood Function = -210.185972 POWER value = 1.000 Log-likelihood Function = -209.316127 POWER value = 1.500 Log-likelihood Function = -209.379714 POWER value = 2.000,The Value of POWER Maximizing Log-likelihood Function = 1.500 Log-likelihood Function = -209.316127,4.2 一元加权最小
9、二乘估计,Analysis of Variance:,Variables in the Equation,4.2 一元加权最小二乘估计,幂指数m的最优取值为m=1.5。 加权最小二乘的r2=0.9360,F值=423.741; 普通最小二乘的r2=0.912,F值=300.732。 说明加权最小二乘估计的效果好于普通最小二乘的效果。,4.2 一元加权最小二乘估计,图4.2 加权最小二乘残差图残差图,4.2 一元加权最小二乘估计,4.2 一元加权最小二乘估计,4.2 一元加权最小二乘估计,4.3 多元加权最小二乘,当误差项i存在异方差时,加权离差平方和为,记,加权最小二乘估计WLS的矩阵表达,4
10、.3 多元加权最小二乘估计,通常取权函数W为某个自变量xj(j=1,2,,p)的幂函数,即, 在x1,x2,xp这p个自变量中取哪一个? 这只需计算每个自变量xj与普通残差的等级相关系数,选取等级相关系数最大的自变量构造权函数。,4.3 多元加权最小二乘估计,例4.4 续例3.2,研究北京市各经济开发区经济发展与招商投资的关系。 因变量y为各开发区的销售收入(百万元), x1为截至1998年底各开发区累计招商数目, x2为招商企业注册资本(百万元)。 计算出普通残差的绝对值abse=|ei|与x1、x2的等级相关系数,re1=0.443,re2=0.721,因而选取x2构造权函数。,4.3 多
11、元加权最小二乘估计,4.3 多元加权最小二乘估计,仿照例4.3,用Weight Estimate估计幂指数m,得m的最优值为m=2。 由于m=2是在默认范围-2,2的边界,因而应该扩大范围重新计算。取m从1到5,步长仍为0.5,得m的最优值为m=2.5,4.3 多元加权最小二乘估计,4.3 多元加权最小二乘估计,加权最小二乘的R2=0.84941,F值=33.84; 普通最小二乘的R2=0.842,F值=31.96。 加权最小二乘估计的拟合效果略好于普通最小二乘。 加权最小二乘的回归方程为: =-266.96+1.696x1+0.4703x2 普通最小二乘的回归方程为: =-327.039+2
12、.036x1+0.468x2,4.3 多元加权最小二乘估计,方差稳定变换,4.3 多元加权最小二乘估计,Box-Cox变换,4.4 自相关性问题及其处理,如果一个回归模型的随机误差项 cov(i ,j)0 则称随机误差项之间存在着自相关现象。 这里的自相关现象不是指两个或两个以上的变量之间的相关,而指的是一个变量前后期数值之间存在的相关关系。,4.4 自相关性问题及其处理,一、自相关性产生的背景和原因 1.遗漏关键变量时会产生序列的自相关性。 2.经济变量的滞后性会给序列带来自相关性。 3.采用错误的回归函数形式也可能引起自相关性。 4.蛛网现象(Cobweb phenomenon)可能带来序
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 部分 违背 基本 假设 情况
链接地址:https://www.31doc.com/p-2531621.html