第4部分违背基本假设的情况.ppt

上传人：本田雅阁

文档编号：2531621

上传时间：2019-04-05

格式：PPT

页数：86

大小：1.51MB

《第4部分违背基本假设的情况.ppt》由会员分享，可在线阅读，更多相关《第4部分违背基本假设的情况.ppt（86页珍藏版）》请在三一文库上搜索。

1、第4章违背基本假设的情况,4.1 异方差性产生的背景和原因 4.2 一元加权最小二乘估计 4.3 多元加权最小二乘估计 4.4 自相关性问题及其处理 4.5 异常值与强影响点 4.6 本章小结与评注,第四章违背基本假设的情况,Gauss-Markov条件,4.1 异方差性产生的背景和原因,一、异方差产生的原因例4.1 居民收入与消费水平有着密切的关系。用xi表示第i户的收入量,yi表示第i户的消费额,一个简单的消费模型为: yi=0+1xi+i，i=1,2,n 低收入的家庭购买差异性比较小, 高收入的家庭购买行为差异就很大。导致消费模型的随机项i具有不同的方差。,4.1 异方差性产生的

2、背景和原因,二、异方差性带来的问题当存在异方差时，普通最小二乘估计存在以下问题: (1)参数估计值虽是无偏的,但不是最小方差线性无偏估计; (2)参数的显著性检验失效; (3)回归方程的应用效果极不理想。,4.2 一元加权最小二乘估计,一、异方差性的检验（一）残差图分析法,图2.5（b) 存在异方差,4.2 一元加权最小二乘估计,一、异方差性的检验（二）等级相关系数法等级相关系数检验法又称斯皮尔曼(Spearman)检验,是一种应用较广泛的方法。这种检验方法既可用于大样本,也可用于小样本。进行等级相关系数检验通常有三个步骤。第一步,作y关于x的普通最小二乘回归,求出ei的估计值,即e

3、i的值。,4.2 一元加权最小二乘估计,（二）等级相关系数法第二步,取ei的绝对值,分别把xi和|ei|按递增（或递减）的次序分成等级,按下式计算出等级相关系数:,其中,n为样本容量,di为对应于xi和|ei|的等级的差数。,4.2 一元加权最小二乘估计,（二）等级相关系数法第三步,做等级相关系数的显著性检验。在n8的情况下,用下式对样本等级相关系数rs进行t检验。检验统计量为:,如果tt/2(n-2)可认为异方差性问题不存在，如果tt/2(n-2),说明xi与|ei|之间存在系统关系,异方差性问题存在。,4.2 一元加权最小二乘估计,例4.3 设某地区的居民收入与储蓄额的历史统计数据如

4、表4.1。 (1)用普通最小二乘法建立储蓄y与居民收入x的回归方程,并画出残差散点图; (2)诊断该问题是否存在异方差;,4.2 一元加权最小二乘估计,4.2 一元加权最小二乘估计,图4.1 残差图,4.2 一元加权最小二乘估计,用SPSS计算等级相关系数。,4.2 一元加权最小二乘估计,（2）计算等级相关系数。,4.2 一元加权最小二乘估计,Spearman等级相关系数可以反映非线性相关的情况， Pearson简单相关系数不能反映非线性相关的情况。例如x与y的取值如下，,容易计算出y与x的简单相关系数r=0.9746，而y与x的等级相关系数rs=1,具有完全的曲线相关。,4.2 一元加权

5、最小二乘估计,二、一元加权最小二乘估计,消除异方差性的方法通常有：加权最小二乘法, Box-Cox变换法, 方差稳定性变换法加权最小二乘法(Weighted Least Square,简记为WLS)是一种最常用的消除异方差性的方法。,4.2 一元加权最小二乘估计,二、一元加权最小二乘估计,一元线性回归普通最小二乘法的残差平方和为：,一元线性回归的加权最小二乘的离差平方和为：,4.2 一元加权最小二乘估计,加权最小二乘估计为：,其中，,是自变量的加权平均；,是因变量的加权平均。,4.2 一元加权最小二乘估计,观测值的权数应该是观测值误差项方差的倒数,即,在实际问题中,误差项的方差是未知的,常

6、与自变量x的幂函数xm成比例，其中m是待定的未知参数。此时权函数为,4.2 一元加权最小二乘估计,三、寻找最优权函数,利用SPSS软件可以确定幂指数m的最优取值。依次点选Analyze-Regression-Weight Estimation进入估计权函数对话框，默认的幂指数m的取值为 m=-2.0，-1.5，-1.0，-0.5，0，0.5，1.0，1.5，2.0。先将因变量y与自变量x选入各自的变量框，再把x选入Weight变量框，幂指数（Power）取默认值，计算结果如下（格式略有变动）：,4.2 一元加权最小二乘估计,Log-likelihood Function = -224.25

7、8830 POWER value = -2.000 Log-likelihood Function = -221.515008 POWER value = -1.500 Log-likelihood Function = -218.832193 POWER value = -1.000 Log-likelihood Function = -216.252339 POWER value = -.500 Log-likelihood Function = -213.856272 POWER value = .000 Log-likelihood Function = -211.773375 POW

8、ER value = .500 Log-likelihood Function = -210.185972 POWER value = 1.000 Log-likelihood Function = -209.316127 POWER value = 1.500 Log-likelihood Function = -209.379714 POWER value = 2.000,The Value of POWER Maximizing Log-likelihood Function = 1.500 Log-likelihood Function = -209.316127,4.2 一元加权最小

9、二乘估计,Analysis of Variance:,Variables in the Equation,4.2 一元加权最小二乘估计,幂指数m的最优取值为m=1.5。加权最小二乘的r2=0.9360，F值=423.741；普通最小二乘的r2=0.912，F值=300.732。说明加权最小二乘估计的效果好于普通最小二乘的效果。,4.2 一元加权最小二乘估计,图4.2 加权最小二乘残差图残差图,4.2 一元加权最小二乘估计,4.2 一元加权最小二乘估计,4.2 一元加权最小二乘估计,4.3 多元加权最小二乘,当误差项i存在异方差时，加权离差平方和为,记,加权最小二乘估计WLS的矩阵表达,4

10、.3 多元加权最小二乘估计,通常取权函数W为某个自变量xj（j=1,2,，p）的幂函数，即，在x1,x2,xp这p个自变量中取哪一个？这只需计算每个自变量xj与普通残差的等级相关系数，选取等级相关系数最大的自变量构造权函数。,4.3 多元加权最小二乘估计,例4.4 续例3.2，研究北京市各经济开发区经济发展与招商投资的关系。因变量y为各开发区的销售收入（百万元）， x1为截至1998年底各开发区累计招商数目， x2为招商企业注册资本（百万元）。计算出普通残差的绝对值abse=|ei|与x1、x2的等级相关系数，re1=0.443，re2=0.721，因而选取x2构造权函数。,4.3 多

11、元加权最小二乘估计,4.3 多元加权最小二乘估计,仿照例4.3，用Weight Estimate估计幂指数m，得m的最优值为m=2。由于m=2是在默认范围-2，2的边界，因而应该扩大范围重新计算。取m从1到5，步长仍为0.5，得m的最优值为m=2.5,4.3 多元加权最小二乘估计,4.3 多元加权最小二乘估计,加权最小二乘的R2=0.84941，F值=33.84；普通最小二乘的R2=0.842，F值=31.96。加权最小二乘估计的拟合效果略好于普通最小二乘。加权最小二乘的回归方程为： =-266.96+1.696x1+0.4703x2 普通最小二乘的回归方程为： =-327.039+2

12、.036x1+0.468x2,4.3 多元加权最小二乘估计,方差稳定变换,4.3 多元加权最小二乘估计,Box-Cox变换,4.4 自相关性问题及其处理,如果一个回归模型的随机误差项 cov(i ,j)0 则称随机误差项之间存在着自相关现象。这里的自相关现象不是指两个或两个以上的变量之间的相关,而指的是一个变量前后期数值之间存在的相关关系。,4.4 自相关性问题及其处理,一、自相关性产生的背景和原因 1.遗漏关键变量时会产生序列的自相关性。 2.经济变量的滞后性会给序列带来自相关性。 3.采用错误的回归函数形式也可能引起自相关性。 4.蛛网现象(Cobweb phenomenon)可能带来序

13、列的自相关性。 5.因对数据加工整理而导致误差项之间产生自相关性。,4.4 自相关性问题及其处理,二、自相关性带来的问题,1.参数的估计值不再具有最小方差线性无偏性。 2.均方误差MSE可能严重低估误差项的方差。 3.容易导致对t值评价过高,常用的F检验和t检验失效。如果忽视这一点,可能导致得出回归参数统计检验为显著,但实际上并不显著的严重错误结论。 4.当存在序列相关时,仍然是的无偏估计量,但在任一特定的样本中, 可能严重歪曲的真实情况,即最小二乘估计量对抽样波动变得非常敏感。 5.如果不加处理地运用普通最小二乘法估计模型参数,用此模型进行预测和结构分析将会带来较大的方差甚至错误的解释。,4

14、.4 自相关性问题及其处理,三、自相关性的诊断,（一）图示检验法 1. 绘制（et，et-1）的散点图。,4.4 自相关性问题及其处理,三、自相关性的诊断,（一）图示检验法 2.按照时间顺序绘制回归残差项et的图形。,4.4 自相关性问题及其处理,三、自相关性的诊断,（二）自相关系数法误差序列1,2,n的自相关系数定义为,自相关系数的估计值为,4.4 自相关性问题及其处理,三、自相关性的诊断,（三）D.W检验 D.W检验是J.Durbin和G.S.Watson于1951年提出的一种适用于小样本的一种检验方法。 D.W检验验只能用于检验随机扰动项具有一阶自回归形式的序列相关问题。这种检验方法

15、是建立计量经济学模型中最常用的方法,一般的计算机软件都可自动产生出D.W值。,4.4 自相关性问题及其处理,（三）D.W检验随机扰动项的一阶自回归形式为: t=t-1+ut 其中ut是不相关序列。为了检验序列的相关性,构造的假设是 H0:=0,4.4 自相关性问题及其处理,（三）D.W检验,定义D.W统计量为:,4.4 自相关性问题及其处理,（三）D.W检验,得,D.W的取值范围为:0D.W4,4.4 自相关性问题及其处理,（三）D.W检验,因而D.W值与的对应关系为,4.4 自相关性问题及其处理,（三）D.W检验,根据样本容量n和解释变量的数目k(这里包括常数项),查D.W分布表,得临

16、界值dL和dU,然后依下列准则考察计算得到的DW值,以决定模型的自相关状态:,4.4 自相关性问题及其处理,（三）D.W检验,4.4 自相关性问题及其处理,4.4 自相关性问题及其处理,（三）D.W检验,D.W检验尽管有着广泛的应用,但也有明显的缺点和局限性。 1. D.W检验有一个不能确定的区域,一旦D.W值落在这个区域,就无法判断。这时,只有增大样本容量或选取其他方法。 2. D.W统计量的上、下界表要求n15,这是因为样本如果再小,利用残差就很难对自相关的存在性作出比较正确的诊断。 3. D.W检验不适应随机项具有高阶序列相关的检验。,4.4 自相关性问题及其处理,四、自相关问题的处理方

17、法,（一）迭代法,以一元线性回归模型为例,设一元线性回归模型的误差项存在一阶自相关 yt=0+1xt+t t=t-1+ut,4.4 自相关性问题及其处理,（一）迭代法,根据回归模型,yt=0+1xt+t,有 yt-1=0+1xt-1+t-1,则有（yt-yt-1)=(0-0)+1(xt-xt-1)+(t-t-1),令,得,4.4 自相关性问题及其处理,四、自相关问题的处理方法,（一）迭代法,其中自相关系数用公式估计。用变换因变量与变换自变量作普通最小二乘回归。如果误差项确实是一阶自相关，通过以上变换，回归模型已经消除自相关。,4.4 自相关性问题及其处理,（一）迭代法,实际问题中，有时

18、误差项并不是简单的一阶自相关，而是更复杂的自相关形式，（4.24）式的误差项ut可能仍然存在自相关，这就需要进一步对（4.24）式的误差项ut做D.W检验，以判断ut是否存在自相关，如果检验表明误差项ut不存在自相关，迭代法到此结束。如果检验表明误差项ut存在自相关，那末对回归模型（4.24）式重复用迭代法，这个过程可能要重复几次，直至最终消除误差项自相关。这种迭代消除自相关的过程正是迭代法名称的由来。,4.4 自相关性问题及其处理,（二）差分法,一阶差分法通常适用于原模型存在较高程度的一阶自相关的情况。在迭代法（4.24）式中，当=1时,得（yt-yt-1)=1(xt-xt-1)+(t-

19、t-1) 以yt=yt-yt-1,xt=xt-xt-1代之,得 yt=1xt+ut 是不带有常数项的回归方程,4.4 自相关性问题及其处理,（二）差分法,一阶差分法的应用条件是自相关系数=1，在实际应用中，接近1时我们就采用差分法而不用迭代法，这有两个原因。第一，迭代法需要用样本估计自相关系数，对的估计误差会影响迭代法的使用效率；第二，差分法比迭代法简单,人们在建立时序数据的回归模型时,更习惯于用差分法。,4.4 自相关性问题及其处理,（三）科克伦奥克特（Cochrane-Orcutt）迭代 ,方法（一）中的迭代法近似取可以使用其他迭代法给出的更精确的估计，最常用的是科克伦奥克特迭代法。

20、以一元线性回归为例，方法（一）的迭代是1步迭代，根据1步迭代计算出的和回归系数，由（4.18）式的回归方程重新计算残差，得到新的残差序列后就可以计算出新的DW值，新的和回归系数，如果新的与前一次迭代的相差很小，低于给定的界限，就停止迭代，否则继续下一步迭代。,4.4 自相关性问题及其处理,（三）科克伦奥克特（Cochrane-Orcutt）迭代 ,有一点需要说明的是，迭代的起始步骤认为是从第0步开始的，就是用（4.18）式做普通最小二乘回归，相当于认为r =0。这样方法（一）中的迭代实际上包括第0步和第1步共两步迭代过程，也称为科克伦奥克特两步法。通常情况下，科克伦奥克特多步迭代与两步

21、迭代相差不大。,4.4 自相关性问题及其处理,（四）普莱斯温斯登（Prais-Winsten）迭代法,采用迭代法用（4.23）式计算迭代值时不能计算第1期的迭代值，因此样本量从n减少到n-1。对大样本量时这无足轻重，但是当样本量较小时每一个样本值都是宝贵的。为此可以使用普莱斯温斯登变换，对t=1，令，经过普莱斯温斯登变换的迭代法就称为普莱斯温斯登迭代法。,4.4 自相关性问题及其处理,五、自相关实例分析,【例4.5】续例2.2,4.4 自相关性问题及其处理,4.4 自相关性问题及其处理,4. 方法比较,4.4 自相关性问题及其处理,对回归模型,yt=0+1xt+t,做变换,得,其中,问

22、题：为什么变换后的回归模型参数估计性质好,4.4 自相关性问题及其处理,自相关的危害,4.4 自相关性问题及其处理,自相关的危害,4.4 自相关性问题及其处理,5 预测,以迭代法为例说明回归预测值,和残差,的计算方法。,4.4 自相关性问题及其处理,5 预测,注意：在自相关回归中，回归预测值,不是用,其一般性的公式为,SPSS软件提供的3种方法可以直接保存回归预测值,和残差,计算,4.4 自相关性问题及其处理,4.4 自相关性问题及其处理,例如，取x20=6600，则,第二种方法,4.5 异常值与强影响值,异常值分为两种情况：一种是关于因变量y异常；另一种是关于自变量x异常。,4.5 异常

23、值与强影响值,一、关于因变量y的异常值,标准化残差,学生化残差,4.5 异常值与强影响值,4.5 异常值与强影响值,可以证明：,4.5 异常值与强影响值,4.5 异常值与强影响值,二、关于自变量x的异常值,4.5 异常值与强影响值,二、关于自变量x的异常值,4.5 异常值与强影响值,二、关于自变量x的异常值,4.5 异常值与强影响值,二、关于自变量x的异常值,虽然强影响点并不总是y的异常值点，不能单纯根据杠杆值hii的大小判断强影响点是否异常，但是我们对强影响点应该有足够的重视。为此引入库克距离，用来判断强影响点是否为y的异常值点。库克距离的计算公式为：,4.5 异常值与强影响值,二、关于自变

24、量x的异常值,对于库克距离，判断其大小的方法比较复杂，一个粗略的标准是当Di1时，认为是异常值点。,4.5 异常值与强影响值,三、异常值实例分析,以例3.2的北京开发区的数据为例，做异常值的诊断分析。分别计算普通残差ei，学生化残差SREi，删除残差e（i），删除学生化残差SRE（i），杠杆值chii，库克距离Di，见表4.10,4.5 异常值与强影响值,4.5 异常值与强影响值,绝对值最大的学生化残差为SRE15=2.613，小于3。绝对值最大的删除学生化残差为SRE（15）=3.810，因而根据学生化残差诊断认为第15个数据为异常值。其中心化杠杆值chii=0.339位于第3大，库克距离 Di=1.555位于第一大。由于,4.5 异常值与强影响值,4.5 异常值与强影响值,4.5 异常值与强影响值,4.5 异常值与强影响值,采用加权最小二乘回归后，删除学生化残差SRE（i）的绝对值最大者为|SRE（13）|=1.7424，库克距离都在0.5至1.0之间，说明数据没有异常值。这个例子也说明了用加权最小二乘法处理异方差性问题的有效性。,

文档加载中……请稍候！
如果长时间未打开，您也可以点击刷新试试。

下载文档到电脑，查找使用更方便

8 元

下载	加入VIP免费专享

版权申诉 word格式文档无特别注明外均可编辑修改；预览文档经过压缩，下载后原文更清晰！ 立即下载

配套讲稿：: 如PPT文件的首页显示word图标，表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
特殊限制：: 部分文档作品中含有的国旗、国徽等图片，仅作为作品整体效果示例展示，禁止商用。设计者仅对作品中独创性部分享有著作权。
关键词：: 部分违背基本假设情况

三一文库所有资源均是用户自行上传分享，仅供网友学习交流，未经上传用户书面授权，请勿作他用。

关于本文

本文标题：第4部分违背基本假设的情况.ppt
链接地址：https://www.31doc.com/p-2531621.html