欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 研究报告>
  • 工作总结>
  • 合同范本>
  • 心得体会>
  • 工作报告>
  • 党团相关>
  • 幼儿/小学教育>
  • 高等教育>
  • 经济/贸易/财会>
  • 建筑/环境>
  • 金融/证券>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > PPT文档下载
     

    第3章多元线性回归模型.ppt

    • 资源ID:2254601       资源大小:3.06MB        全文页数:166页
    • 资源格式: PPT        下载积分:10
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录   微博登录  
    二维码
    微信扫一扫登录
    下载资源需要10
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    第3章多元线性回归模型.ppt

    第3章 多元线性回归模型,“多元”回归模型,在现实的计量经济分析中,事实上影响被解释变量的因素不止一个,通常会有多个影响因素。 即使我们的分析目的是考察某一个因素对被解释变量的影响,但为了得到该因素对被解释变量的“净影响”,也需要将其他影响因素作为“控制变量”,使其以显性形式出现在模型中,以提高模型估计精度。 因此,需要建立包含两个及以上解释变量的多元回归模型。,基本内容,第一节 多元线性回归模型的概念(重点) 第二节 多元线性回归模型的参数估计(掌握) 第三节 多元线性回归模型的统计检验(掌握) 第四节 非线性回归模型(重点) 第五节 案例 生产函数的应用,本章要点,第一节 多元线性回归模型的概念,重点: 1.对多元线性回归模型参数意义的理解 2.对无多重共线性假定的理解,第一节 多元线性回归模型的概念,一、总体线性回归模型 二、样本线性回归模型 三、多元线性回归模型的基本假定,多元:含有两个以上解释变量 线性:对参数而言线性 如果总体回归函数描述了一个被解释变量与多个解释变量之间的线性关系,由此而设定的回归模型就称为多元线性回归模型。,一、总体线性回归模型,假定被解释变量Y与K个解释变量X1,X2,Xk存在线性相关关系: (i=1,2,,n) 称为总体线性回归模型。,一、总体线性回归模型,其中:,为截距项,代表排除在模型之外的所有因素对被解释变量Y的平均影响; (j=1,2k)为偏回归系数,反映了在其它解释变量保持不变的情况下,解释变量Xj变化一个单位时,对被解释变量Y的影响程度。 ui为随机扰动项,因此,对应于解释变量的每一组观察值(X1i,X2i,Xki),被解释变量Yi的值是随机的。,多元线性回归模型的参数与一元线性回归模型的参数有重要区别。在多元线性回归模型中,解释变量对应的参数是偏回归系数,表达的是控制其他解释变量不变的条件下,该解释变量的单位变动对被解释变量平均值的“净影响”。这个独特性质使多元回归中不但能够引入多个解释变量,而且能够“分离”出每个解释变量对被解释变量的影响。,注意:,总体线性回归函数,把被解释变量Yi的总体条件期望与解释变量X1,X2,Xk存在的线性关系式: E(Y/ X1i,X2i,Xki)= 称为K元线性总体回归函数。 特别的,当K=2时,二元线性总体回归模型的形式为: 二元线性总体回归函数形式为:,第一节 多元线性回归模型的概念,一、总体线性回归模型 二、样本线性回归模型 三、多元线性回归模型的基本假定,二 、样本线性回归模型,K元线性样本回归函数表达式为: 其中, 是总体均值 的估计 多元线性样本回归模型表达式为: 其中,残差项ei是随机扰动项ui的估计。,二 、样本线性回归模型,特别地,当K=2时,二元线性样本回归函数为 二元线性样本回归模型为:,二元线性样本回归函数几何图形表示,回归平面示意图,第一节 多元线性回归模型的概念,一、总体线性回归模型 二、样本线性回归模型 三、多元线性回归模型的基本假定,三、多元线性回归模型的基本假定,假定1:线性回归模型,或模型是参数的线性函数。 假定2:X值固定或独立于误差项。这意味着随机扰动项和 每个X变量之间的协方差为0。 假定3:零均值假定,即干扰项均值为0。 E(ui)=0(i=1,2,n) 假定4:同方差假定,即干扰项的方差保持不变。 i =1,2,n,三、多元线性回归模型的基本假定,假定5:无自相关假定,干扰项之间无自相关或序列相关。 cov(ui,uj)=0,(ij; i,j=1,2,n) 假定6:观测次数n必须大于待估计参数个数。 假定7:X变量值必须存在变异。,三、多元线性回归模型的基本假定,另外两个要求 假定8:无设定偏误,模型被正确地设定。 假定9:解释变量之间不存在完全共线性,没有精确的线性 关系。,无多重共线性假定: 各解释变量之间不存在严格的线性关系,或者说各解释变量之间线性无关;亦即解释变量之间不存在精确的线性关系,即是说不存在一列不全为0的数 ,能使下式成立: 反之,如果仅当 ,上式才成立,就说变量是线性无关的。,三、多元线性回归模型的基本假定,注意: 无多重共线性假定是针对解释变量之间的关系而设定,根本目的是保证模型可以估计。如果解释变量之间存在完全多重共线性,会造成数据观测矩阵X非列满秩,模型参数将无法估计。在实际做计量经济分析时,很多经济变量虽然不存在完全的线性关系,却通常都存在一定的相关性,不一定满足多重共线性的假定,模型的估计可能会受到影响。,三、多元线性回归模型的基本假定,假定10:正态性 进行假设检验时,干扰项服从均值为0,方差为 的正态分布。,三、多元线性回归模型的基本假定,本章要点,第二节 多元线性回归模型的参数估计,重点: 1.多元线性回归参数的最小二乘估计 2.参数最小二乘估计式的数值性质 3.参数最小二乘估计式的统计性质,第二节 多元线性回归模型的参数估计,一、多元线性回归参数的最小二乘估计 二、最小二乘估计量的数值性质 三、最小二乘估计量的统计性质 四、参数的估计误差与置信区间,总体线性回归模型 样本线性回归模型 OLS方法是要选择未知参数值,使残差平方和尽可能小,一 、多元线性回归参数的最小二乘估计,以二元线性回归模型为例 做最小二乘估计:,一 、多元线性回归参数的最小二乘估计,OLS要求回归平面能使 Y与该平面的离差平方和为最小,1.先对三个未知参数求偏导数,并令所得结果为零,即得3个方程的方程组:,2.化简得正规方程,3.如果观测次数不少于3次,而X1和X2 之间不存在线性关系,则由此正规方程组,可解得参数的OLS估计式如下:,4.按照用小写字母表示对样本均值离差的惯例,我们导出以下公式:,第二节 多元线性回归模型的参数估计,一、多元线性回归参数的最小二乘估计 二、最小二乘估计量的数值性质 三、最小二乘估计量的统计性质 四、参数的估计误差与置信区间,二 、最小二乘估计量的数值性质,1.样本均值点在样本平面上,即 2.剩余项(残差)ei的均值为零,即 3. Y的估计值的均值等于Y的观测值均值,即 4.解释变量与剩余项不相关,即 cov(Xji,ei)=0 5.剩余ei与估计量不相关,即cov(ei, )=0,第二节 多元线性回归模型的参数估计,一、多元线性回归参数的最小二乘估计 二、最小二乘估计量的数值性质 三、最小二乘估计量的统计性质 四、参数的估计误差与置信区间,三、最小二乘估计量的统计性质,在古典线性回归模型的基本假定下,一元线性回归模型的OLS估计量是最优线性无偏估计量,这个性质对于多元线性回归同样成立。,三、最小二乘估计量的统计性质,第二节 多元线性回归模型的参数估计,一、多元线性回归参数的最小二乘估计 二、最小二乘估计量的数值性质 三、最小二乘估计量的统计性质 四、参数的估计误差与置信区间,四、参数的估计误差与置信区间,根据矩阵相等的意义,矩阵相等即对应位置的元素相等,回归参数估计量 的方差、标准差,协方差 其中 为矩阵 中第 i行和第j列元素。 特别地,对二元回归模型而言:,1参数的估计误差,可证明,由此得:,令,即,因此,,称为方程的估计标准误差。,2参数的置信区间,N( ,Cj+1,j+1 ) 进行标准化标准化得: 由数理统计定理可知: 所以,对于给定的置信度1- ,由分布表可查得临界值 使得,即:,偏回归参数,的100(1-,)%的置信区间为:,即以100(1- )的概率保证回归参数属于该区间内。,由于偏回归系数都是与变量的原有单位有直接的联系,计量单位不同,彼此不能直接比较计量单位不同的解释变量对被解释变量的影响大小。 为此,在比较被解释变量对各个解释变量的敏感性时,可以将偏回归系数转换为Beta系数,其定义如下:,3. 标准化系数(Beta系数),特别的,对二元回归模型: 两边减去 得到: 变形: 进行变量的标准化变换, 因为 所以 则,1.如果将一个变量在减去其均值后再除以其标准差,我们就说把这个变量标准化了。标准化变量其均值总是0,标准差总是1。 2.对标准化的回归子和回归元做回归,截距项总是0,是一个过原点的回归。 3.标准化变量的回归系数Beta系数可解释为,如果标准化回归元增加一个单位的标准差,则标准化回归子平均增加 单位个标准差。度量变量影响以其标准差作为单位。,注意:,5.标准化回归模型的优点在于我们可以用beta系数作为各个回归元相对解释力的一种度量,通过将回归元标准化,可以将其放在同等地位并直接进行比较。 如果一个标准化回归元的系数比模型中另一个标准化回归元的系数大,那么前者就能比后者更多地解释回归子。,注意:,本章要点,第三节 多元线性回归模型的统计检验,重点: 1.为什么要对可决系数加以修正 2.个别参数显著性t检验与模型整体显著性F检验的关系 3. F检验与拟合优度之间的关系,第三节 多元线性回归模型的统计检验,一、模型的拟合优度检验 二、偏回归系数的显著性检验 三、模型总体线性显著性检验,一、模型的拟合优度检验,设估计的多元样本线性回归函数为 则带残差项的多元样本线性回归模型为 则,1总离差平方和分解,总离差平方和,由最小二乘法知,因此,回归平方和与残差平方和,记成 TSS = RSS + ESS,总离差平方和,回归平方和,残差平方和,2判定系数,用回归平方和(ESS)占总平方和(TSS)的比重作为衡量模型对样本拟合优度的指标,称为多元判定系数,用符号R2表示: 显然, , 并且当 越接近于1时, 越接近于0;因此,R2的值越接近1,则表明模型对样本数据的拟合优度越高。,回归平方和分解,用式: 减式: 得: 由于 于是 因此,在多元回归中R2是模型中解释变量个数的非减函数,也就是说,随着模型中解释变量个数的增加, 的值通常都会变大。为了得到拟合优度较高的模型,似乎加入更多解释变量是合理选择,但是在建立计量经济模型时,随着解释变量个数的增加,待估计的参数也会增多,由此造成样本自由度减少,模型参数估计的准确性下降。,注意:,因此,在多元回归模型中,仅仅依据R2对模型作比较和选择会产生问题,在增加新的解释变量时,必须对由其带来的模型自由度下降这一“负面影响”而做出“惩罚”,因此,需要对R2作出相应的修正。,注意:,3.校正判定系数:,在一元回归中判定系数为 由于 于是,校正的办法,将 中的第二项乘一个不小于1的因子,若方程中解释变量个数k大,所乘因子也大;在样本容量一定的情况下,由于RSS的自由度n-k-1随着解释变量个数k的增大而减少。如果用自由度去校正所计算的变差平方和,就可以克服因为解释变量个数不同而引起的判定系数对比的困难。 因此定义 为校正判定系数。,的联系,由于是 k0 n-k-10 1-R20 所以,即:校正的判定系数 不大于一般判定系数,调整后的判定系数受哪些因素的影响,校正判定系数的特点,因为,若 ,则由,所以,当,时,,,,这时就取,。,4.赤池信息准则和施瓦茨准则,为了比较所含解释变量个数不同的多元回归模型的拟合优度,常用的标准还有: 赤池信息准则(Akaike information criterion, AIC),施瓦茨准则(Schwarz criterion,SC),这两准则均要求仅当所增加的解释变量能够减少AIC值或AC值时才在原模型中增加该解释变量。,第三节 多元线性回归模型的统计检验,一、模型的拟合优度检验 二、偏回归系数的显著性检验 三、模型总体线性显著性检验,二、偏回归系数的显著性检验,1.提出假设: 2.构造统计量:在H0成立的条件下, 3.计算原假设成立时 tj 统计量的值。 4.在给定显著性水平 的条件下,查t分布表,得临界值 。,H0:j=0 (j=1,2k),H1:j0,5判断:,则拒绝,接受,这是因为接受H0的概率保证程度很大,也就是说,接受H1犯错误的概率很小;说明所对应的解释变量对被解释变量Y有显著的线性影响。 若 则不能拒绝 即 与0的差异不显著,这种情况,只有接受H0,犯错误的概率才会小;说明对应的解释变量对被解释变量Y线性作用不显著。,若,第三节 多元线性回归模型的统计检验,一、模型的拟合优度检验 二、偏回归系数的显著性检验 三、模型总体线性显著性检验,三、模型总体线性显著性检验,由于Yi的总变差可以分解为两部分 显然,模型的总显著性越强,说明模型中所有解释变量对被解释变量Y的联合影响程度越大,ESS在TSS中所占比重就越大,故利用比值 对总体线性关系进行推断。 由于对不同的样本,这个比值可能不同,因此对给定的样本,利用这个比值进行推断,必须在统计假设检验的基础上作出。,总体线性显著性检验的步骤,至少有一个不为0,1.提出关于 K 个总体参数的假设。 2.构造统计量:可以证明:在k元线性回归的条件下, 和 分别服从自由度为k和n-k-1的 分布。即 根据数理统计中的定理可知, 因此,利用F统计量进行总体线性显著性检验,F检验,3.在原假设成立的条件下,计算F统计量的值; 4.给定显著性水平 ,查F分布表得临界值 ; 5.若 ,则拒绝 ,即回归模型是显著成立,这说明回归模型中的解释变量对被解释变量是有共同影响,也就是说,回归总体是显著线性的。 若 ,则不拒绝 ,即回归模型不显著成立,说明解释变量对被解释变量是没有显著的线性影响关系。,F检验和判定系数R2关系,可以看出,F与R2同向变化,当 时 , 当R2 越大时,F值越大,当R2 趋向于1时,F趋向于 。 因此,用来判断估计的回归方程联合显著性的F检验,实际也就是对判定系数的显著性检验。 亦即,检验原假设 , 等价于检验 这一虚拟假设。,本章要点,被解释变量和解释变量之间的线性关系,包括参数线性和解释变量线性两种。,严格意义上来讲,OLS是针对参数、变量均线性的模型进行估计,为什么基本假定只要求相对参数线性即可?,第四节 非线性回归模型,即使在参数线性回归模型的约束下,回归模型也可以有多种形式: 倒数模型 双对数模型 半对数模型 多项式模型 所有这些模型的一个重要特征是,它们都是参数线性模型,或者通过简单的代数处理转化成参数线性模型,但变量却不一定是线性的。,转换技巧: 直接代换法 间接代换法 级数展开法 应用研究中经常出现的函数形式的变形和推广。,第四节 非线性回归模型,重点: 1.双对数线性模型参数的经济含义 2.半对数线性模型参数的经济含义 3.级数展开法的基本思想,第四节 非线性回归模型,一、直接代换法 二、间接代换法 三、级数展开法,对于参数线性的模型,可以采用变量的直接代换,转化为参数、变量均为线性的形式进行估计。 1.倒数模型 函数形式为下式的称为倒数模型:,倒数模型的一个显著特征是,随着X的无限增大, 趋于零,Y接近渐近值。,一、直接代换法,曲线形状,令变量 ,则回归函数可变为:,根据解释变量的观测值,计算出X*i 的之后进行OLS估计,得到:,因此可得到原模型的估计方程:,如何转换?,倒数变换模型特点,随着X的无限增大, Yi将非线性递减(Y将接近于零),逐渐接近极限值 ,即有一个渐近下限或渐近上限。 由于这种模型的曲线形状呈现双曲线的变化规律,又称其为双曲线模型。 在现实中,平均固定成本曲线,恩格尔消费曲线,菲利普斯曲线恰好有类似的变动规律,因此,可以用倒数变换模型进行描述。,平均固定成本曲线,在短期: 总固定成本为一条水平线,平均固定成本曲线等于从原点到总成本曲线上相应产量点连线的斜率。随着产出的不断增加,AFC将逐渐降低 ,最终接近临界值。,恩格尔消费曲线,恩格尔曲线表示消费者在每一收入水平下对某种商品的需求量。 恩格尔曲线的形状取决于特定商品的性质、消费者的偏好以及保持不变的价格水平。正常商品的消费量随着收入的增加而增加,但其增长率是递减的。高档商品的消费量是随收入增加而递增的,且其增长速度也是递增的。,恩格尔消费曲线,正常商品,高档商品,恩格尔消费曲线,若用X表示消费者总收入,Y表示消费数量,则正常商品的恩格尔曲线具有如下特征: 1.收入有一个临界值,在此之下,不能购买商品。 2.消费有一个满足水平,在此水平之上,不会再有任何消费。,中国2006-2011年恩格尔系数,菲利普斯曲线,菲利普斯根据英国货币工资变化的百分比Y与失业率X的数据,得到菲利普斯曲线。 工资的变化随失业水平的变化是不对称的:当失业率低于自然失业率u0时,工资随失业率单位变化而上升比在失业率高于自然失业率u0时工资随失业率单位变化而下降得要快。,菲利普斯曲线,2.双对数模型(不变弹性模型),模型,令,可变为线性回归模型,根据解释变量的观测值,计算出Y*i和 X*i 的之后用最小二乘法对参数进行估计,得到: 和 分别是 和 的最佳线性无偏估计式。,双对数模型的假设检验,线性模型与双对数模型的假设检验并没有什么不同,在随机扰动项服从正态分布的假设下,估计的回归系数服从正态分布。,双对数线性模型的特点,对数结构方程 两边微分得: 双对数线性模型的回归系数 恰好就是被解释变量 关于解释变量 的弹性。,三个变量的对数线性回归模型 :,令变量 , 则回归函数可变为:,根据解释变量的观测值,进行OLS估计,得到:,因此可得到原模型的估计方程:,三个变量的对数线性回归模型 :,注意: 模型中的偏回归系数又称为偏弹性系数,每一个偏回归系数度量了在其他变量保持不变的条件下,被解释变量Y对某一解释变量的偏弹性。,3.半对数模型,仅有一个变量以对数形式出现的回归模型称为半对数模型。 对数-线性模型:被解释变量为对数形式的模型,线性-对数模型:解释变量为对数形式的模型,3.半对数模型,根据解释变量的观测值,进行OLS估计,得到:,因此可得到原模型的估计方程:,分别令:,或,半对数线性模型参数的意义,两边求微分得:,对线性对数模型:,从而,,对于对数线性模型:,两边求微分得:,则,住房价格与空气污染,住房价格与空气污染,住房价格与空气污染,广泛使用对数模型的原因:,1.使用自然对数使得对系数的解释颇具吸引力,而且由于斜率系数不随测度单位而变化,所以我们可以忽略以对数形式出现的变量的度量单位。 2.当Y0时,使用lnY作为被解释变量的模型,通常比使用Y的水平值作为被解释变量的模型更接近CLM假定。严格为正的变量,其条件分布常常具有异方差性或偏态性,取对数后,即使不能消除这两方面的问题,也可以使之有所缓和。,广泛使用对数模型的原因:,3.使用自然对数通常会缩小变量的取值范围,在某些情况下还相当可观。这就使得估计值对被解释变量或解释变量的异常(或极端)观测不是那么敏感。,线性模型与对数模型的比较,在线性模型、对数模型选择过程中,有如下经验规律: 1.双变量下,做散点图。 2.多变量下,依据理论基础、统计显著性等标准进行综合判断。 3.可决系数不是重要标准。因为线性模型的可决系数度量了X对Y变动解释的比例,而双对数模型的可决系数度量了lnX对lnY变动解释的比例。Y的变动与lnY的变动从概念上看是不同的。,线性模型与对数模型的比较,4.具有大正整数特征的变量通常可以取对数,如国内生产总值、物质资本存量、就业人员数、人口、工资等变量。以年度量的变量通常以原有形式出现,如受教育年数、年龄等变量。比例或百分比变量尽管存在使用其水平值的趋势,但我们既可以使用原有形式,也可以使用其对数形式。这是因为任何原变量的回归系数,都具有一种百分点变化的解释,如失业率、投资率、消费率等变量。,线性模型与对数模型的比较,注意: 使用对数模型所受到的一个限制是,变量不能取零或负值。但在Y非负又可等于零的情形中,有时采用ln(1+Y)。除了从Y=0开始的变化外,通常的百分比变化几乎完全保留了其解释。一般而言,当Y的数据包含相对较少的零时,使用ln(1+Y),并把估计值作为变量为lnY时的解释,通常是可以接受的。,对数模型的缺陷,使用对数形式的被解释变量有一个缺陷,即更难预测原变量的值。原模型使我们能预测lnY,而不是Y。不过,把对lnY的预测转变成对Y的预测也是相当容易的。一个相关的问题是,将Y作为被解释变量的模型与lnY作为被解释变量的模型进行可决系数的比较是不合逻辑的。它们解释的是不同变量的变异。,4.多项式模型,令变量 ,模型转化成多元线性回归模型 从而最小二乘法进行参数估计以及进一步的检验。这个模型在生产与成本函数中被广泛使用。,模型的函数为:,解释变量以不同次幂进入模型。,总成本(TC)、边际成本(MC)和平均成本AC与产出的关系曲线:,污染对住房价格的影响,污染对住房价格的影响,污染对住房价格的影响,第四节 非线性回归模型,一、直接代换法 二、间接代换法 三、级数展开法,二、间接代换法,在某些经济问题中,经济变量之间的非线性关系,不能象前面那样直接代换转化为线性形式,需要先通过函数变换(通常是对方程两边取对数),然后进行变量代换,使其转化线性形式,再进行参数估计。因此,称为间接代换法。,1.幂函数模型:,若被解释变量Y和解释变量X之间的关系呈现幂函数形式 该模型中变量Yi关于Xi和参数都是非线性的,对这类问题的线性化方法是将两边取对数,做恒等变换得:,令,则,再令,则,2.指数函数模型:,若被解释变量Y和解释变量X之间的关系呈现指数函数形式: 对这类模型线性化的方法,也是只需对两边取对数,即得: 实际上是对数线性模型,只要令 就可化为: 再用线性回归模型参数估计的方法估计出 和 进一步可得,第四节 非线性回归模型,一、直接代换法 二、间接代换法 三、级数展开法,三、级数展开法(迭代估计法),基本思想 : 通过泰勒级数展开法,先使非线性模型在某一初始参数估计值附近线性化,然后对这一线性模型应用最小二乘估计方法,得出一组新的参数估计值,接着使原非线性的模型在新参数估计值附近线性化,对新的线性模型再应用最小二乘估计方法,又得出一组新的参数估计值,不断重复上述过程,直至参数估计值收敛时为止。,具体步骤如下:,设模型:,其中:k为解释变量个数,p为参数的个数, f为非线性函数,且f是 的连续可导函数。,第一步,选定一组参数初始估计值,将函数f在初始值处展开,(3-97),整理得:,第二步:作变量代换,令:,第三步:由于上式是一个多元线性回归模型, 可用最小二乘法估计出一组参数,。,第四步,重复第一步,对作另一次泰勒级数展开得,,代换后得到新的线性回归模型,再应用最小二乘法,又得出一组参数的估计值 ;,第五步,如此反复,得到一系列,直到参数估计值收敛或第,次估计值的估计误差,小于事先取定的误差精度时为上,即满足如下条件时 为止:,以第 次的计算结果作为参数 的估计值。,从上述估计过程可以看出,迭代估计过程的收敛性及收敛速度与参数初始值的选取密切相关。若选取的初始值与参数真值比较接近,则收敛速度较快;反之,则收敛缓慢甚至发散。 因此,估计模型时最好依据参数的经济意义和有关先验信息,设定好参数的初始值。 这种方法计算量较大,而且迭代过程可能不收敛,这时应重选一组新的初始参数值,重新作逐次线性的近似估计。,说明:,首先,由于非线性模型中的参数估计量同随机项不成线性关系,所以它们不服从正态分布,也不能从回归残差中得出随机扰动项的方差的无偏估计量,其结果使得t检验和F检验都不适用。 其次,用上面方法得出的样本回归方程,可用来预测未来某个时期f的因变量的值。,非线性回归模型应用举例,研究的选题,1.要尽量选择在经济和社会领域中受到广泛关注的问题,所研究问题的题目要具体化。 2.要明确研究的范围。 3.所选题目的大小要适中。 4.要充分考虑数据来源的可能性。,应用举例,一、计量经济模型的设定 二、变量说明与数据处理 三、参数估计与计量检验 四、宏观经济研究问题,一、计量经济模型的设定,(一)数理经济模型构建 (二)样本数据特征观察 (三)计量经济模型建立,数理经济模型构建,1.新古典生产函数的基本假定 (1) 假定经济中仅有物质资本和劳动两种投入,生产函数形式为: (2) 假定资本折旧率是一个常数。在一个时点上物质资本存量的变化等于总投资减去生产过程中的资本损耗。,数理经济模型构建,2.新古典生产函数的性质 如果忽略技术进步,也就是说我们假定F(·)独立于t,生产函数可以采取如下形式: (1)对所有K0和L0,生产函数F(·)对每一投入具有正的且递减的边际产品:,数理经济模型构建,(2) F(·)呈现出不变规模报酬,满足一次齐次性: (3)满足稻田条件,即随着资本或劳动趋于零,资本或劳动的边际产品趋于无穷大;随着资本或劳动趋于无穷大,资本或劳动的边际产品趋于零:,数理经济模型构建,3.新古典生产函数的形式 科布-道格拉斯函数提供了对现实经济的合理描述,在此假定生产函数符合科布-道格拉斯函数形式:,应用举例,一、计量经济模型的设定 二、变量说明与数据处理 三、参数估计与计量检验 四、宏观经济研究问题,样本数据特征观察,变量随着时间变动趋势,样本数据特征观察,以国内生产总值为横轴,样本数据特征观察,以国内生产总值为纵轴,一、计量经济模型的设定,(一)数理经济模型构建 (二)样本数据特征观察 (三)计量经济模型建立,计量经济模型建立,1. 确定模型包含的变量 因素:产出、物质资本、劳动 变量:GDP、资本存量K、劳动力人数L 数据可得性 变量之间的关系:GDP被解释变量、K和L解释变量,计量经济模型建立,2.确定模型的数学形式 单一方程还是联立方程模型?单一方程 具体函数形式:根据相关经济理论得出符合科布-道格拉斯函数 根据样本数据做出的变量关系图印证 C-D生产函数随机回归方程设定为:,对数变换,计量经济模型建立,3.拟定模型中待估参数的理论期望值区间 符号:+ 大小:0-1之间,两者之和是否接近于1,计量经济模型设定,柯布-道格拉斯函数提供了对现实经济的合理描述,刻画了一个反映产出与劳动力和资本投入之间的关系的生产函数: C-D生产函数随机回归方程设定为:,应用举例,一、计量经济模型的设定 二、变量说明与数据处理 三、参数估计与计量检验 四、宏观经济研究问题,变量说明与数据处理,(一)数据来源 1.年鉴 中国统计年鉴及各地区统计年鉴 新中国60年统计资料汇编 中国国内生产总值核算历史资料(19521996) 中国国内生产总值核算历史资料(19522004) 专业年鉴 如中国金融年鉴、中国科技统计年鉴,变量说明与数据处理,2.网络 国家统计局统计数据网页 中国人民银行统计数据网页 中国证券监督管理委员会统计数据网页 世界银行WDI数据库 联合国UNdata数据库,变量说明与数据处理,3.共享 人大经济论坛 中国经济学教育科研网 新浪爱问 经济学家 各大高校网站(如南开大学、山东大学),变量说明与数据处理,(二)变量说明 1.产出变量 国内生产总值(GDP) 指按市场价格计算的一个国家(或地区)所有常住单位在一定时期内生产活动的最终成果。在实际核算中,国内生产总值有三种计算方法,即生产法、收入法和支出法。三种方法分别从不同的方面反映国内生产总值及其构成。,变量说明与数据处理,2.资本变量物质资本存量 支出法国内生产总值中资本形成总额 或全社会固定资产投资 3.劳动力变量 经济活动人口 就业人员合计,变量说明与数据处理,(三)数据处理 1.真实GDP 常规错误:国内生产总值指数是根据两个时期不变价国内生产总值计算得到,因此将国内生产总值指数看作是GDP平减指数。 国内生产总值指数(上年=100)的定义为:,变量说明与数据处理,则GDP平减指数的环比指数公式为: GDP定基指数 真实GDP=名义GDP除以GDP平减指数,变量说明与数据处理,2.真实资本存量 普遍采用的资本存量的测算方法是永续盘存法,基本公式为: 中国统计年鉴自1991年开始才公布固定资产投资价格指数 资本折旧率的取值,变量说明与数据处理,(2)地区 资本存量的估算可以写作: 3. 就业人数,应用举例,一、计量经济模型的设定 二、变量说明与数据处理 三、参数估计与计量检验 四、宏观经济研究问题,参数估计,估计结果,经济意义检验,Lucas(1988)的内生经济增长理论认为经济增长是规模报酬递增的,规模报酬递增来源于人力资本及其外部效应。人力资本的外部效应社会劳动力的平均人力资本水平具有核心作用,并且这些效应会从一个人扩散到另一个人,因而会对所有生产要素的生产率都有贡献,从而使生产呈现出规模报酬递增收益,而正是这种源于人力资本外部效应的递增收益使人力资本成为“增长的发动机”。,模型修正,沿用第一部分的设定的生产函数形式,重新写出如下:,变量说明,人力资本存量的测算 (1) 颜鹏飞等(2004):在校大学生人数与总人口比例 (2)许和连等(2006):中等及以上学校在校学生人数 (3)岳书敬等(2006):平均受教育年限与劳动力数量乘积 平均受教育年限 由各学历层次年限乘以各学历所占总人口比重并加总算得,其中设定“初等教育”年限为6 年(主要指小学阶段) 、“初中等教育”年限为9年(主要指初中)、“高中等教育”年限为12年(主要指高中和中专)、“高等教育”年限为16 年(主要指大专及以上文化程度) 。,相关参考资料,参考文献 (1)颜鹏飞、王兵,2004:技术效率、技术进步与生产率增长:基于DEA的实证分析,经济研究第12期。 (2)许和连、元朋、祝树金,2006:贸易开放度、人力资本与全要素生产率:基于中国省级面板数据的经验分析,世界经济第12期。 (3)岳书敬、刘朝明,2006:人力资本与区域全要素生产率,经济研究第4期。 (4)Holz, C.,2005, The Quantity and Quality of Labor in China 1978-2000-2025,Working Paper.,再次参数估计,统计推断检验,(1)可决系数 注意:可决系数与相关系数的区别 可决系数反映了样本回归函数对样本点的拟合的优良程度;相关系数反映两变量之间关系的密切程度。 可决系数反映两变量之间依存关系;相关系数判定时两变量之间是对称的。 0R21 -1r1,统计推断检验,可决系数随解释变量的增加而增大,没有解释力,为防止这种情况出现,对其重新定义,除以自由度,即校正可决系数。 (2)参数的显著性水平检验 给出显著性水平,查自由度为n-k-1的t分布表得临界值,如果各解释变量系数的t值大于临界值则拒绝原假设,存在显著影响。 (3)总体回归方程的检验,计量经济检验,(1)自相关检验 图示法:判断没有客观标准 Durbin-Watson检验(n15) 给定显著性水平,查DW表得上下限临界值进行判断。 解决途径广义差分法、二步迭代法,计量经济检验,计量经济检验,(2)异方差检验 GQ检验、White检验 解决途径加权最小二乘法、重新设定模型 (3)多重共线性检验 只有两个解释变量的情况下,解释变量之间的相关系数可用作多重共线性的测度,但当解释变量多于两个时,相关系数则不可能充分测度。 如果多重共线性存在,当R2、F值很大时,一般t值会很小,无法通过检验。 解决途径对时间序列数据作差分、逐步回归法,计量经济检验,后续工作,1.模型的调整 模型的调整是指对模型检验提出的问题如何予以解决。 2.模型计量结果的分析,注意,在模型检验中不存在什么“通行的模式”可以在模型检验过程中遵照执行,因为在模型检验的每个阶段都需要大量地判断,并且不同的人所使用的检验方法也不尽相同。,应用举例,一、计量经济模型的设定 二、变量说明与数据处理 三、参数估计与计量检验 四、宏观经济研究问题,参考题目,1. 居民消费、家庭储蓄问题 2.收入分配、公共服务均等化问题 3.全要素生产率、经济增长方式问题 4.结构调整、产业升级问题 5.通货膨胀、经济波动问题 6.生态环境、节能减排问题,

    注意事项

    本文(第3章多元线性回归模型.ppt)为本站会员(本田雅阁)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    经营许可证编号:宁ICP备18001539号-1

    三一文库
    收起
    展开