第03章基本回归模型s.ppt
《第03章基本回归模型s.ppt》由会员分享,可在线阅读,更多相关《第03章基本回归模型s.ppt(73页珍藏版)》请在三一文库上搜索。
1、1,第三章 基本回归模型,经济计量研究始于经济学中的理论假设,根据经济理论设定变量间的一组关系,如消费理论、生产理论和各种宏观经济理论,对理论设定的关系进行定量刻画,如消费函数中的边际消费倾向、生产函数中的各种弹性等进行实证研究。单方程回归是最丰富多彩和广泛使用的统计技术之一。本章介绍EViews中基本回归技术的使用,说明并估计一个回归模型,进行简单的特征分析并在深入的分析中使用估计结果。随后的章节讨论了检验和预测,以及更高级,专业的技术,如加权最小二乘法、二阶段最小二乘法(TSLS)、非线性最小二乘法、ARIMA/ARIMAX模型、GMM(广义矩估计)、GARCH模型和定性的有限因变量模型。
2、这些技术和模型都建立在本章介绍的基本思想的基础之上。,2,对于本章及随后章节所讨论的技术,可以使用下列的经济计量学教科书作为参考。下面列出了标准教科书(逐渐变难): (1) Pindyck,Rubinfeld (1991), Econometric Models and Economic Forecasts, 经济计量模型和经济预测,第三版。 (2) Johnston 和 DiNardo (1997),Economtric Methods, 经济计量方法,第四版。 (3) Greene (1997),Economtric Analysis, 经济计量分析,第三版。 (4) Davidson 和
3、MacKinon (1993),Estimation and Inference in Econometrics , 经济计量学中的估计和推断。 在适当的地方,对于特定的专题, 我们也会提供专门的参考书。,3,3.1 创建方程对象,EViews中的单方程回归估计是用方程对象来完成的。为了创建一个方程对象: 从主菜单选择Object/New Object/Equation 或 Quick/Estimation Equation ,或者在命令窗口中输入关键词equation。 在随后出现的方程说明对话框中说明要建立的方程,并选择估计方法。,4,3.2 在EViews中对方程进行说明,当创建一个方程
4、对象时,会出现如下对话框:,在这个对话框中需要说明三件事:方程说明,估计方法,估计使用的样本。在最上面的编辑框中,可以说明方程:因变量(左边)和自变量(右边)以及函数形式。 有两种说明方程的基本方法:列表法和公式法。列表法简单但是只能用于不严格的线性说明;公式法更为一般,可用于说明非线性模型或带有参数约束的模型。,5,3.2.1 列表法 说明线性方程的最简单的方法是列出方程中要使用的变量列表。首先是因变量或表达式名,然后是自变量列表。例如,要说明一个线性消费函数,用一个常数 c 和收入 inc 对消费 cs 作回归,在方程说明对话框上部输入: cs c inc 注意回归变量列表中的序列 c。这
5、是EViews用来说明回归中的常数而建立的序列。EViews在回归中不会自动包括一个常数,因此必须明确列出作为回归变量的常数。内部序列 c 不出现在工作文档中,除了说明方程外不能使用它。 在上例中,常数存储于c(1),inc的系数存储于c(2),即回归方程形式为: cs = c(1)+c(2)*inc。,6,在统计操作中会用到滞后序列,可以使用与滞后序列相同的名字来产生一个新序列,把滞后值放在序列名后的括号中。 cs c cs(-1) inc 相当的回归方程形式为: cs = c(1)+ c(2) cs(-1)+c(3) inc。 通过在滞后中使用关键词 to 可以包括一个连续范围的滞后序列。
6、例如: cs c cs(-1 to -4) inc 这里cs关于常数,cs(-1),cs(-2),cs(-3),cs(-4),和inc的回归。,在变量列表中也可以包括自动序列。例如: log(cs) c log(cs(-1) log(inc+inc(-1)/2) 相当的回归方程形式为: log(cs) = c(1)+c(2) log(cs(-1)+c(3) log(inc+inc(-1)/2),7,3.2.2 公式法说明方程 当列表方法满足不了要求时,可以用公式来说明方程。许多估计方法(但不是所有的方法)允许使用公式来说明方程。 EViews中的公式是一个包括回归变量和系数的数学表达式。要用公
7、式说明一个方程,只需在对话框中变量列表处输入表达式即可。EViews会在方程中添加一个随机附加扰动项并用最小二乘法估计模型中的参数。,8,用公式说明方程的好处是可以使用不同的系数向量。要创建新的系数向量,选择Object/New Object 并从主菜单中选择Matrix-Vector-Coef , 为系数向量输入一个名字。然后,选择OK。在New Matrix对话框中,选择Coefficient Vector 并说明向量中应有多少行。带有系数向量图标 的对象会列在工作文档目录中,在方程说明中就可以使用这个系数向量。例如,假设创造了系数向量 a 和beta,各有一行。则可以用新的系数向量代替
8、c : log(cs)=a(1)+ beta(1)* log(cs(-1),9,3.3 在EViews中估计方程,说明方程后,现在需要选择估计方法。单击Method:进入对话框,会看到下拉菜单中的估计方法列表:,标准的单方程回归用最小二乘估计。其他的方法在以后的章节中介绍。采用OLS,TSLS,GMM,和ARCH方法估计的方程可以用一个公式说明。非线性方程不允许使用binary,ordered,censored,count模型,或带有ARMA项的方程。,10,3.4 方程输出,在方程说明对话框中单击OK钮后,EViews显示估计结果:,根据矩阵的概念, 标准的回归可以写为: 其中: y 是因变
9、量观测值的 T 维向量,X 是解释变量观测值的 T k 维矩阵,T 是观测值个数,k 是解释变量个数, 是 k 维系数向量,u 是 T 维扰动项向量。,11,3.4.1 系数结果 1. 回归系数 (Coefficient) 系数框描述了系数 的估计值。最小二乘估计的系数 b 是由以下的公式计算得到的,如果使用列表法说明方程,系数会列在变量栏中相应的自变量名下;如果是使用公式法来说明方程,EViews会列出实际系数 c(1), c(2), c(3) 等等。 对于所考虑的简单线性模型,系数是在其他变量保持不变的情况下自变量对因变量的边际收益。系数 c 是回归中的常数或者截距-它是当其他所有自变量都
10、为零时预测的基本水平。其他系数可以理解为假设所有其它变量都不变,相应的自变量和因变量之间的斜率关系。,12,例3.1: 本例是用中国1978年2002年的数据建立的城镇消费方程: cst=c0+c1inct+ut 其中: cs 是城镇居民消费;inc 是可支配收入。方程中c0代表自发消费,表示收入等于零时的消费水平;而c1代表了边际消费倾向,0c11,即收入每增加1元,消费将增加 c1 元。从系数中可以看出边际消费倾向是0.514。也即1978年2002年中国城镇居民可支配收入的51.4%用来消费。,13,2. 标准差 (Std.Error) 标准差项报告了系数估计的标准差。标准差衡量了系数估
11、计的统计可信性-标准差越大,估计中的统计干扰越大。 估计系数的协方差矩阵是由以下公式计算得到的:,这里 是残差。而且系数估计值的标准差是这个矩阵对角线元素的平方根。可以通过选择View/Covariance Matrix项来察看整个协方差矩阵。,其中,14,3. t-统计量 t统计量是由系数估计值和标准差之间的比率来计算的,它是用来检验系数为零的假设的。 4. 概率(P值) 结果的最后一项是在误差项为正态分布或系数估计值为渐近正态分布的假设下, 指出 t 统计量与实际观测值一致的概率。 这个概率称为边际显著性水平或 P 值。给定一个 P 值,可以一眼就看出是拒绝还是接受实际系数为零的双边假设。
12、例如,如果显著水平为5% ,P 值小于0.05就可以拒绝系数为零的原假设。 对于例1的结果,系数 inc 的零假设在1%的显著水平下被拒绝。,15,3.4.2 方程统计量,1. R2 统计量 R2 统计量衡量在样本内预测因变量值的回归是否成功。R2 是自变量所解释的因变量的方差。如果回归完全符合,统计值会等于1。如果结果不比因变量的均值好,统计值会等于0。R2 可能会由于一些原因成为负值。例如,回归没有截距或常数,或回归包含系数约束,或估计方法采用二阶段最小二乘法或ARCH方法。 EViews计算R2 的公式为: ,,其中, 是残差, 是因变量的均值。,16,2. R2 调整 3. 回归标准差
13、 (S.E. of regression),4.残差平方和,5. 对数似然函数值,17,6. Durbin-Watson 统计量,7. 因变量均值和标准差(S.D),8. AIC准则(Akaike Information Criterion),其中l 是对数似然值,9. Schwarz准则,18,10. F统计量和边际显著性水平 F统计量检验回归中所有的系数是否为零(除了常数或截距)。对于普通最小二乘模型,F统计量由下式计算:,在原假设为误差正态分布下,统计量服从 F(k 1 , T k) 分布。,F统计量下的P值,是F检验的边际显著性水平。如果P值小于所检验的边际显著水平,则拒绝所有系数都为
14、零的原假设。注意F检验是一个联合检验,即使所有的t统计量都是不显著的,F统计量也可能是高度显著的。,19,3.5 方程操作,3.5.1 方程视图 以三种形式显示方程:EViews命令形式,带系数符号的代数方程,和有系数估计值的方程。,可以将这些结果剪切和粘贴到支持Windows剪贴板的应用文档中。,20, Estimation Output显示方程结果。 Actual, Fitted, Residual以图表和数字的形式显示因变量的实际值和拟合值及残差。 Actual, Fitted, Residual Table 以表的形式来显示这些值。,21, Gradients and Derivati
15、ves.描述目标函数的梯度和回归函数的导数计算的信息。详细内容参见附录E, “梯度和导数”。 Covariance Matrix以表的形式显示系数估计值的协方差矩阵。要以矩阵对象保存协方差矩阵,可以使用cov函数。 Coefficient Tests, Residual Tests, and Stability Tests 这些是 “定义和诊断检验”中要详细介绍的内容。,22,3.5.2 方程过程, Specify/Estimate. 编辑方程说明、改变估计方法、估计样本。 Forecast . 用估计方程的预测。 Make Modle 创建一个与被估计方程有关的未命名模型。 Update C
16、oefs from Equation 把方程系数的估计值放在系数向量中。 Make Regressor Group 创建包含方程中使用的所有变量的未命名组(常数除外)。 Made Residual Series. 以序列形式保存回归中的残差。 Make Derivative Group 创建包含回归函数关于其系数的导数的组。 Made Gradient Group 创建包含目标函数关于模型的系数的斜率的组。,23,1. 回归方程的函数形式,下面讨论几种形式的回归模型: (1) 双对数线性模型(不变弹性模型) (2)半对数模型 (3)双曲函数模型 (4)多项式回归模型 所有这些模型的一个重要特征
17、是:它们都是参数线性模型,但是变量却不一定是线性的。,(1) 双对数线性方程 双对数线性模型估计得到的参数本身就是该变量的弹性。,3.6 线性回归方程的应用实例,例3.3: 下面建立我国居民消费的收入弹性方程: log(cst) = 0.18 + 0.917log(inct) t =(1.01) (45.72) R2 = 0.989 D.W. = 0.447 其中cst 是城镇居民消费,inct 是居民消费可支配收入。,24,方程中消费的收入弹性为0.917,说明我国城镇居民收入每增加1%,将使得城镇居民消费增加0.917%。,25,(2) 半对数模型 线性模型与对数线性模型的混合就是半对数模
18、型 或 对数方程又称增长模型,通常我们用这类估计许多变量的增长率。如果x取“时间”t,即按时间顺序依次取值为1,2,T,变量t 的系数1 度量了ln(y)随时间向前推进产生的变化。如果1为正,则有随时间向上增长的趋势;如果1为负,则有随时间向下的趋势,因此t可称为趋势变量,而且 是y的平均增长率。宏观经济模型表达式中常有时间趋势,在研究经济长期增长或确定性趋势成分时,常常将产出取对数,然后用时间t作解释变量建立回归方程。,26,例3.4: 我们建立半对数线性方程,估计我国实际GDP(支出法,样本区间:19782002年)的长期平均增长率,模型形式为 其中:GDPPt 表示剔出价格因素的实际GD
19、Pt 。方程中时间趋势变量的系数估计值是0.0815,说明我国实际GDP(支出法)年平均增长率为8.15%。F值或R2表明模型拟合效果很好,D.W.显示模型存在(正的)自相关。,27,(3) 双曲函数模型 形如下式的模型称为双曲函数模型 这是一个变量之间是非线性的模型,因为Xt 是以倒数的形式进入模型的,但这个模型却是参数线性模型,因为模型中参数之间是线性的。这个模型的显著特征是随着Xt 的无限增大,(1/Xt )接近于零。,28,例3.5 美国菲利普斯曲线 利用美国19551984年的数据(附录E.2),根据菲利普斯曲线,即通货膨胀率 t 和失业率 Ut 的反向关系,建立双曲函数:,估计结果
20、表明,菲利普斯曲线所描述的 t 和Ut 的反向关系并不存在。之所以出现这样的背离,主要是因为20世纪70年代出现石油危机,从而引发了“滞胀”,通货膨胀伴随着高失业率。如果考虑到通货膨胀预期的影响,则可以在模型中引入代表通货膨胀预期的变量,比如用通货膨胀前期值来代表。,29,含有通货膨胀预期的菲利普斯曲线估计结果为,可以看出,加入通货膨胀预期因素后,模型的拟合效果很好,而且这时的模型体现出了失业率和通货膨胀率之间的显著的反向变动关系。,30,2. 虚拟变量的应用 例3.6:工资差别 为了解工作妇女是否受到了歧视,可以用美国统计局的“当前人口调查”中的截面数据研究男女工资有没有差别。这项多元回归分
21、析研究所用到的变量有: W 雇员的工资(美元/小时) 1;若雇员为妇女 SEX = 0;其他 ED 受教育的年数 AGE 雇员的年龄 1;若雇员不是西班牙裔也不是白人 NONWH = 0;其他 1;若雇员是西班牙裔 HISP = 0;其他,31,对206名雇员的样本所进行的研究得到的回归结果为(括号内是t统计量的值): (22.10)(-3.86) R2 = 0.068 D.W.=1.79 反映雇员性别的虚拟变量SEX在显著性水平 5%下显著。因为工资的总平均是9.60美元,该虚拟变量告诉我们,妇女的平均工资为8.12美元,或比总平均低1.48美元。,32,在回归模型中加入年龄AGE和受教育年
22、数ED以及种族或民族,性别虚拟变量仍然是显著的: (-3.38) (-4.61) (8.54) (4.63) (-1.07) (0.22) R2=0.367 D.W.=1.78,33,最后考虑年龄AGE与工资W之间非线性关系的可能性时,男女差别还是显著存在的。这一点可以由下列回归结果看出: (-4.59) (-4.50) (7.98) (-1.22) (0.28) (3.87) (-3.18) R2=0.398 D.W.=1.75,这个回归模型的年龄AGE项说明,在其他条件不变的情况下,雇员的工资率随着他的年龄的增长而增长(系数为0.62),但是增加的速度越来越慢(-0.0063)。进一步的研
23、究表明,工资在雇员的年龄为42.9岁时达到最大,之后逐年下降。,34,例3.7 季节虚拟变量 当使用含有季节因素的经济数据进行回归分析时,可以对数据进行季节调整消除原数据带有的季节性影响,也可以使用虚拟变量描述季节因素,进而可以同时计算出各个不同季度对经济变量的不同影响。如果用虚拟变量,这时包含了4个季度的4种分类,需要建立3个虚拟变量。用Qi表示第i个季度取值为1,其他季度取值为0的季节虚拟变量,显然Q1 + Q2 + Q3 + Q4 = 1 ,如果模型中包含常数项,则只能加入Q1,Q2,Q3 ,否则模型将因为解释变量的线性相关而无法估计,即导致虚拟变量陷阱问题。当使用月度数据时,方法与上述
24、类似,但需要有11个虚拟变量。,35,图3.1-1 社会消费品零售总额RS 图3.1-2 GDP,通过图3.1,可以看出1995年1季度2003年1季度的季度GDP和社会消费品零售额RS存在明显的季节因素(数据见附录E表E.4),GDP通常逐季增加,也有一些年份中第二季度高于第三季度。RS在第一季度增加,第二季度减小,第三季度略有上升,第四季度达到高峰。,36,下面利用季度数据对我国的国民生产总值GDP和社会消费品零售额RS进行回归分析,分别考虑不包含和包含虚拟变量的情形。不包含虚拟变量的回归结果为 (3.3.9) t = (1.44) (9.11) R2= 0.73 D.W. =1.64 使
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 03 基本 回归 模型
链接地址:https://www.31doc.com/p-2978749.html