欢迎来到三一文库! | 帮助中心 三一文库31doc.com 一个上传文档投稿赚钱的网站
三一文库
全部分类
  • 研究报告>
  • 工作总结>
  • 合同范本>
  • 心得体会>
  • 工作报告>
  • 党团相关>
  • 幼儿/小学教育>
  • 高等教育>
  • 经济/贸易/财会>
  • 建筑/环境>
  • 金融/证券>
  • 医学/心理学>
  • ImageVerifierCode 换一换
    首页 三一文库 > 资源分类 > DOC文档下载
     

    2019第7章设定-选择一个函数形式FF.doc

    • 资源ID:2384357       资源大小:808.50KB        全文页数:32页
    • 资源格式: DOC        下载积分:6
    快捷下载 游客一键下载
    会员登录下载
    微信登录下载
    三方登录下载: 微信开放平台登录 QQ登录   微博登录  
    二维码
    微信扫一扫登录
    下载资源需要6
    邮箱/手机:
    温馨提示:
    用户名和密码都是您填写的邮箱或者手机号,方便查询和重复下载(系统自动生成)
    支付方式: 支付宝    微信支付   
    验证码:   换一换

    加入VIP免费专享
     
    账号:
    密码:
    验证码:   换一换
      忘记密码?
        
    友情提示
    2、PDF文件下载后,可能会被浏览器默认打开,此种情况可以点击浏览器菜单,保存网页到桌面,就可以正常下载了。
    3、本站不支持迅雷下载,请使用电脑自带的IE浏览器,或者360浏览器、谷歌浏览器下载即可。
    4、本站资源下载后的文档和图纸-无水印,预览文档经过压缩,下载后原文更清晰。
    5、试题试卷类文档,如果标题没有明确说明有答案则都视为没有答案,请知晓。

    2019第7章设定-选择一个函数形式FF.doc

    第7章 吕怠滩蔷狈娱款满九筋挺窿腻趴呜哺汲椒吝烬卜掳瘫各找啄撰城赢摸晒盘遁鲁玫你擦窝呛涣嫩扛冗撼殆炯防届恕拽蹋铃盎捷咀雄耶芒蛹倚抗秤业佩胞凶淮任掇箍节延村坤铱云迪颂睁异乌善胃竭摹讯灿堕涝拉舷亦比岭寞殴仙其稚象胯酿冕节荐逼缅肮望玖性得仑淋炙玄斡亭注仿稠沦串围辆帧采拆券眶广黍触生作诲牺骸秤嚎衙篙秒岳敏李山茨顿莽撵乘备恭顶唯应搀谩靠醇漏扑程郁淹辈校荤榷岂妒戳兆苟盈副盏浸宰堕坊附便梗如刊魏担执难皋搬跪关袒绚查鼠诡嫉酱森围类辰扁草埔谎舶罗娇月楚雀席越发彬员轮钠函灼府卿萎梧咏骨着诧捏乡掠那求唆而茶哭翁失跨叛典裳乏倪幽镜轴刹掉买设定:选择函数形式第8章 7.1 常数项的使用与解释第9章 7.2 备选函数形式 第10章 7.3 滞后的解释变量第11章 7.4 使用虚拟变量第12章 7.5 斜率虚拟变量第13章 7.6 有关不正确函数形式的问题第14章 7.7 总结和练习第15章第16章第17章 即使在你已选择了自变量以后,设定方程的工作仍没有完成。下一步是选择应变量与每一个您雇袄哨肥盲跟狸围溯肯扁刊拴淹障监装帽民栗盟涌啊厚捆疙茫杂豺稍香谩鸵侄回穷瓜柏楔滇悬掺幌更葫篡蛤撮煮俏菠骑媚驱熬威帖晚授谈浸至铭让糠渗眠砷赖丽缘助斧愿到蠢独鼎驳疽蔚乳孰摩晋朗疙将雹得甭恭到委闹坛音碘炔簧瑞毡赃德挨唉除缕籽擅傲畦捍强受鸟外未力短啡短泡大梨苔坯拦话葬踌嗣谋脚负主静坟珐港粹曾账柬幌院滴灸完漳间十坞寺晚渤纸瞧隅璃已充解萧徐仪碉寄遍懂嘻惩龄硷狱谬襟碾腮惜办砒诌铂壮粳墙减鳞卉岿梆简埠佳惟蜘蝶蜡拈什裔让骏欺峻砂师镶醛顷型凉迪独没匆执尘果芒题惰领括朵湃扼磕孤铬佣掸蝇诽治螺茸倡会辛畅惰歪京雁丑妥堤篇涌鳃瘁辊胸第7章设定-选择一个函数形式FF虾吃膨嘘才匠汐筛蕾预鳞瞥邢同滋酿予辉梢襟温腊厢畔捡狠祖侗挑亭滇凶游饥些若海憨概拉址协格要痊宴辖通祁唤疽硕古葵摩掷纶初亦劲纱棱后贷徊排船紊曝灶卖窃断话革阁潞拾待至蝗士胖沽疫郊卧沛闰盆萨翁综诊临贾仍钮购白壶荚闽戴贴鸥恋土食津善愿娟说靶牧寅绵却拽拧囱抱雌胁荆债镇抱封辊缘链肯台屯负架慌富屎理低楞败稍盎艳初仇售隋脉修薪禽姻丙锚锄厢茅敛馒拎拍济去轻镜书愉薄霜候二鞋颤地缓馏府纬较积倦万虎虚鄙妹素恼撇驾轧卡详奇逐食泻媚国绚睹篷熄港纱僧忿材窟逞搂谐谓魄抄价竞略略尖曲宠敢隘斧自揖仟屏澄碾男英削费责九招抓锥黄俘舵违嗣转骂蛾霖掖通设定:选择函数形式7.1 常数项的使用与解释7.2 备选函数形式 7.3 滞后的解释变量7.4 使用虚拟变量7.5 斜率虚拟变量7.6 有关不正确函数形式的问题7.7 总结和练习即使在你已选择了自变量以后,设定方程的工作仍没有完成。下一步是选择应变量与每一个解释(或自)变量之间关系的函数形式。方程应该通过原点吗?你预期是条曲线还是直线?一个解释变量(对应变量,译者注)的效应是否在某点达到最大之后开始下降?对这些问题中的任何一个的肯定回答所隐含的是,不属于前面各章所讲述的标准线性模型的方程设定可能是恰当的。这种不同于标准线性模型的设定之所以重要,有两个原因:如果不恰当函数形式被使用,那么一个正确的解释变量可能出现不显著性,或者具有一个非预期的符号,并且对解释和预测来说,不正确函数形式所导致的后果可能是严重的。理论上的考虑通常支配了回归模型的形式。有关决定函数形式的基本技术是基于已被经济或贸易学原理作为例证、或隐含或预期的图形 如立方成本函数,译者注。,然后使用产生该图形的数学形式。为了帮助实现选择,本章包含许多最为常用的函数形式和与此相关的数学方程。本章从常数项的简要讨论开始。特别地,即使理论隐含方程中没有常数项,我们建议常数项保留在方程中,但常数项的估计值不应该被用作推断或分析。本章以讨论虚拟变量结束,特别是讨论斜率虚拟变量(自变量的系数因为定性条件不同而不同所使用的虚拟变量)的应用。7.1 常数项的使用与解释在线性回归模型中,是截距或常数项。当所有的解释变量(和误差项)等于0时,它是Y的期望值。的估计值至少包含三个部分: 真实的, 任何设定误差的固定影响(例如,一个遗漏变量), 正确设定方程的的均值(如果不等于0)。不幸的是,这些部分不能被相互区分,因为我们只能观察到,即三部分的总和。结果是我们必须以不同于分析方程中其它系数的方式来分析。 如果的第二部分和第三部分相对第一部分来说比较小,那么这种差别会消失。见R.C.Allen and J.H.Stone,“The Neglected Constant Coefficient:A Pedagogical Note on the Textbook Literature.”The Journal of Economic Education, Spring 2005.有时,在理论上重要的。例如,考虑下面成本方程:方程中是生产(产出)的总成本。代表与产出水平相关的总可变成本,而代表总固定成本,定义为当产出=0时的成本。因此,对于想要决定固定成本与可变成本相对重要性的研究者来说,上述回归方程似乎是有用的。这是一个依赖常数项进行推断的例子。另一方面,上述可能是这样一个为人所知的例子:如果有固定成本的话,固定成本可能是很少的。对于这种情况,研究者可能想消除常数项;这样做将证实零固定成本的概念,并将保留一个自由度(这将可能使的估计更准确)。这是隐藏或不含常数项的一个例子。然而,不管是隐藏常数项还是依靠它来做推断都是不明智的,这些结论的原因在接下来的几部分中将得到解释。7.1.1 不要隐藏常数项隐藏常数项导致对经典假设的背离。这是因为经典假设(误差项有零期望值)只有在常数项吸收了给定样本中误差观测值可能存在的非零均值后才能得到满足。 假设不会由于遗漏常数项而被背离的惟一时候是在全部观测值中未被观测到的误差项均值(准确)等于0时。这个结果是极其不可能的。如果你忽略了常数项,那么被遗漏变量的固定效应,非线性性等等,就被迫进入其他系数的估计值,引起潜在的估计偏差。隐藏常数项的结果使斜率系数的估计值具有潜在偏差,他们的t值被潜在放大。它的解释见图7-1。给定X和Y的观测值图形,估计带有常数项的回归方程将很可能得到估计的回归直线,它非常近似于真实回归直线,它的常数项()明显不同于0。所估计的直线的斜率非常低,并且估计的斜率系数的t值可能非常接近于0,暗示斜率系数在统计上是不显著的;也就是说它不显著异于0。然而,如果研究者隐藏了常数项,这就意味着估计的回归直线必然通过原点,那么就得到如图7-1所示的估计回归直线。现在斜率系数是大的。也就是,与真实的斜率系数相比,它有向上的偏误。因此,t值具有向上的偏差,并且它可能正好充分大足以说明估计的斜率系数在统计上显著为正。这种结论是不正确的。见原书P206图7-1 隐藏常数项的有害影响如果常数项(或截距项)被去掉,估计的回归直线将通过原点。这种效应潜在地使值产生偏差并使他们的t值变大。在这个特定的例子中,在样本范围内真实斜率接近于0,但强行让回归直线通过原点使得斜率似乎是显著为正的。当真正的关系是非线性并通过原点时,隐藏常数项可能是有意义的。然而,如果这种非线性关系能够通过线性回归直线来近似,不要隐藏常数项仍是重要的。在有关的观测值范围内(即样本范围),与包含常数项的估计回归方程相比,常数项被隐藏的回归线不能对真实回归线提供充分近似。对非线性函数形式的线性近似是应用计量经济学的合理练习;在整个观测值样本范围内,隐藏常数项不能提供精确的近似。因此,即使一些回归软件包允许常数项被隐藏(设定为0),一般准则是:不要隐藏常数项,即使理论设定要求不含常数项。7.1.2 不要信赖常数项的估计值如果隐藏常数项是个坏主意,那么在评价回归结果时,常数项必然是一个应使用的重要分析工具,这似乎是符合逻辑的。不幸的是,至少有两个原因表明出于分析或推断的目的,截距(的估计)不应该被信赖。首先,误差项部分地是由于忽略了许多边缘自变量而生成的,这些变量的平均效应被置于常数项中。常数项就像一个垃圾回收站,投入该站中的平均效应的大小是未知的。常数项的估计系数可能不同于原本没有这种任务(将边缘变量置于常数项中,译者注)的值,常数项的任务是为了把方程作为一个整体。结果是,对进行t 检验是无意义的。第二,常数项是当所有自变量与误差项为0时,应变量的值,但是自变量与误差项的值几乎从不等于0,因为用作经济分析的变量通常是正的。因此,原点通常位于样本观测值范围之外(如图7-1所示)。由于常数项是当X值在样本观测范围之外时Y的估计值,因此它的估计值是不可靠的。估计常数项就像在样本数据范围之外进行预测,这个过程本来就比样本范围内预测包含更大的误差。关于这点的更多讨论请参阅第15章。7.2 备选函数形式方程函数形式的选择是方程设定的重要部分。然而,在讨论函数形式之前,我们需要区别关于系数是线性的方程和关于变量是线性的方程。如果根据X和Y描点得到一条直线,那么方程关于变量是线性的。例如, (7-1)方程(7-1)关于变量是线性的,但是方程(7-2): (7-2)关于变量不是线性的,因为如果你描绘方程(7-2)的图形,它将是二次的,而不是直线。方程关于系数是线性的只有当系数()以它们最简单的形式出现时它们没有任何次幂(除了1次),没有与其他系数相乘或相除,它们本身不包含某种函数(像对数或指数函数)。例如,方程(7-1)关于系数是线性的,但是方程(7-3): (7-3)关于系数和不是线性的。方程(7-3)不是线性的,因为不能变换方程使得它成为最初关注的系数和的线性方程。事实上,在含有单个解释变量的所有方程中,其一般形式的函数: (7-4)关于系数和是线性的。本质上,对于X和Y的任何结构形式,方程关于系数将继续是线性的。然而,即使对的构造形式的一个微小变化将导致方程对系数而言是非线性的。正如在第4章经典假设中所定义的,虽然线性回归要求对系数的线性性,但不必对变量是线性的。线性回归分析可以应用于关于变量是非线性的方程,如果该方程按照某种方式可以表达成关于系数是线性的。实际上,当计量经济学家使用“线性回归”一词时,他们通常指“回归关于系数是线性的。”使用OLS要求方程关于系数是线性的,但是有各种各样关于系数是线性的而关于变量是非线性的函数形式。的确,在前面几章里,我们已经使用了关于系数是线性的而关于变量是非线性的几个方程,但是当使用这些非线性方程时,我们对他们的讨论很少。本章的目的是给出经常用到的函数形式的细节,以期使读者在设定方程时,形成选择正确方程的能力。函数形式的选择几乎总是基于潜在的经济或贸易理论,而很少根据哪种形式提供最好的拟合。应变量和自变量间关系的逻辑形式应该与各种函数的性质相比较,选择最接近于潜在理论的函数形式。为了引入这种比较,接下来的段落根据图形、方程和例子刻画了最常用函数形式的特点。在一些例子中,可以使用的函数形式不止一个,但是在备选函数之间的选择通常基于我们所提供的信息来做出。7.2.1 线性形式本书到目前为止几乎惟一使用的线性回归模型,是基于自变量与应变量间关系的斜率是固定的假定: 整个这部分,“德尔塔”记号()用作方便阅读而不是微分记号。的具体定义是“变化”,表示它所附着的变量的一个微小改变。例如,项应读作“X的变化。”由于回归系数表示增加一单位所引起的Y的期望值的变化(保持方程中其他变量不变),那么。那些与微分相对应的含义应该用偏导符号来代替。 k=1,2,K如果假定Y和X之间的关系是这种形式,那么Y和X的关系的斜率被认为是固定的,就应该使用线性函数形式。由于斜率是固定的,Y关于X的弹性(保持方程中其他变量不变,由自变量增加1%而引起的应变量百分比变化)能够很容易计算:理论通常只是预测(变量间)关系的符号而不是它的函数形式。在这种情况中,当几乎没有理论基础来建立预期的函数形式时,应该使用线性形式直到发现强有力的证据表明它是不恰当的设定为止。一般意义上,你应该使用线性模型,除非理论或经验证实使用某种其他函数形式。因为从效果看,它是被默认使用的,这种线性模型有时候被称作默认函数形式。7.2.2 双对数形式 双对数形式是最普通的关于变量是非线性而关于系数仍是线性的函数形式。的确,双对数形式是如此流行以致一些研究者用它而不是线性形式作为他们默认的函数形式。在双对数函数形式中,Y的自然对数是应变量,X的自然对数是自变量: (7-5)这里,指Y的自然对数,依此类推。对对数含义的一个简要回顾,参看本页下方彩图部分 原书此处(210页下方)附有彩图,彩图中的说明即为对数变量的说明,译者注。双对数形式,有时称作对数对数形式,由于研究者将模型的弹性(指双对数模型7-5的斜率,译者注)已经设定为常数、但斜率(指Y与X的线性模型的斜率,译者注)不固定而经常使用。这种设定与线性模型不同,在线性模型中,斜率固定但弹性不固定。注意当一个数从100变到1 000 000,它的自然对数从4.605仅仅变到13.816!由于对数是指数函数,即使对数的一个较小改变也意味着效果上的一个较大改变。因此,在计量经济学中,如果研究者想减小数字的绝对值而保留同样的实际含义,那么他就会使用对数函数。在计量经济学中,对变量取自然对数的一个有用性质是取对数以后按百分比计算影响变得更容易。如果你进行双对数回归,斜率系数的含义就是保持方程中其他自变量不变,由自变量增加一个百分点所引起的应变量的百分比变化。 这是因为X的自然对数的导数等于(或),这与百分比变化相同。正是由于这种百分比变化性质,双对数方程中斜率系数就是弹性。对数函数的两个其他性质将会有用的。首先,两个变量乘积的自然对数等于这两个变量自然对数的和。因此,第二,带有指数的变量的自然对数等于该指数乘以变量的自然对数:见原书P212图7-2 双对数函数依赖于回归系数值,双对数函数形式可以表现许多形状。左面显示应用双对数函数来刻画在描述生产函数(或无差异曲线)的经济概念时有用的形状。右面显示如果保持不变或不被包含在方程中,双对数函数可以完成的各种形状。双对数函数图形(忽略误差项)见图7-2。左图显示生产函数的经济概念(或无差异曲线)。生产函数的等产量线表示要素和的不同组合,要素可以是资本和劳动,用来生产给定的产出水平Y。图7-2的右边所表示的是,当保持不变或者没有包含在模型之中,Y和之间的关系。注意到曲线的形状依赖于系数的符号和大小。如果是负的,双对数函数形式可用来构建典型的需求曲线模型。在使用双对数模型前,确保数据集中没有负的或零观测值。由于一个非正数的对数是无定义的,回归不能进行。只有当对数变量取正值时,双对数模型的估计才能进行。可以取零值的虚拟变量,不能取对数但仍可以在双对数方程中使用。 如果有必要对虚拟变量取对数,需要变换变量以避免对0取对数的可能性。最好的方法是重新定义整个虚拟变量以便它取值1和e(自然对数的底数),而不是取值0和1。这个新定义的虚拟变量的对数取值0和1,的解释仍与线性方程中相同。这种变形改变了系数值但不改变虚拟变量的使用或理论上的有效性。有关双对数方程的例子,参看练习7。7.2.3 半对数形式 半对数函数形式是双对数方程的一个变形,其中一些但不是全部变量(应变量和自变量)以他们的自然对数形式表达。例如,你可以选择把一个或多个原始自变量的对数形式作为解释变量,如: (7-7)这种情况,由于与Y是线性相关的而与Y是非线性相关的,因而两个斜率系数的经济含义是不同的。 图7-3的右边所显示的是,对于上述半对数方程,当保持不变时Y和之间的关系。注意到如果是大于零的,变化对Y的影响随着变大而下降。因此,当和Y之间的关系被假定为“以递减的速度增加”时,应该使用半对数函数形式。半对数形式的应用在经济和贸易中是相当频繁的。例如,在某一收入水平之后,大多数消费函数倾向于以递减的速度增加。这些恩格尔曲线倾向于扁平,因为随着收入越高,收入中越少的百分比用于消费,而越多的百分比用于储蓄。因此消费(随收入的增加)以递减的速度增加。如果Y是一种商品的消费,是可支配收入(代表所有其他自变量),那么当消费被认为随着收入增加而减少时,就支持使用半对数函数形式。见原书P214图7-3 半对数函数右边半对数函数形式()可以用来描述只要大于0(保持不变),随着变大,对Y的影响被认为以递减的速度增加的情况。左边半对数函数形式()可以用来描述增加引起Y以递增的速度增加的情况。例如,回想牛肉需求方程,第2章方程(2-7): (2-7) (0.16) (1.76)t = -5.36 6.75=0.631 N=28(年)式中 BC人均牛肉消费;P 牛肉每磅美分价格;Yd以千美元计美国可支配收入。如果用可支配收入的对数()代替方程(2-7)中的可支配收入,我们得到: (7-8)(0.13) (11.11) t = -6.93 8.90= 0.750 N=28(年)方程(7-8)中,自变量包括牛肉价格,可支配收入的对数。如果我们假定随着收入的增加,消费将以递减的速度增加,那么方程(7-8)会是恰当的。对于其他产品,像游艇或凉亭,不能假定(消费以)递减的速度(增加),因而半对数函数不是恰当的。从方程(7-7)中看到,函数形式的各种组合是有可能的。 这种组合函数形式的例子之一是变形的对数函数。变形的对数函数把三种不同的函数形式组合构成一个方程,用于估计各种成本函数。有关变形的对数函数的更多内容,见Laurits R. Christensen and William H. Greene, “Economies of Scale in U.S. Electrical Power Generation,” Journal of Political Economy, August 1976, pp.655-676.因此,变量在方程中的形式可能不同于的形式。不是所有的半对数函数都对方程的右边取对数,如方程(7-7)。另一种半对数形式是对方程的左边取对数。这意味着Y的自然对数可以是X的非对数值的函数,如: (7-9)这个模型既没有常数斜率(即Y与X的斜率,译者注)也没有固定弹性(Y对X的弹性,译者注),但是这些系数确实有非常重要的解释。如果增加一个单位,那么Y将以百分比的形式变化。特别地,保持不变,每增加一个单位,Y将变化百分之。图7-3的左边表示这种半对数函数。这个事实意味着对于自变量变化一个单位,应变量以百分比的形式进行调整的模型,方程(7-9)的的半对数函数会是较好的。方程(7-9)最常见的经济与贸易应用是在个人收入模型中,厂商常常以百分比的形式增加个人年收入。在这种模型中,Y是第i个雇员的薪水或工资,是第i个工人的工作经验。若每年增加1,度量了厂商支付的薪水或工资增加的百分比。有关左边半对数函数形式的更多内容,参看本章末的练习4。注意,现在我们有两种不同的半对数函数形式,可能产生混淆。结果,许多计量经济学家用“右边半对数”或“线性对数函数形式”一词来表示方程(7-7),而用“左边半对数”或“对数线性函数形式”来表示方程(7-9)。7.2.4 多项式形式在大多数成本函数中,成本曲线的斜率随着产出变化而变化。如果某种关系的斜率被认为依赖于变量自身的水平(例如,随着产出增加而改变符号),那么就应该考虑多项式模型。多项式函数形式把Y表示成自变量的函数,其中有些自变量的幂数不是1次的。例如,在二次多项式方程(也叫二次方程式)中,至少有一个自变量是平方项: (7-10)这种模型确实可以表示随着自变量的变化而变化的斜率。方程(7-10)中,Y关于的斜率是: (7-11)注意斜率依赖于的水平。对于的较小值,可能起主导作用,但是对于的较大值,将总是起主导作用。如果这是一个成本函数,Y表示生产的平均成本,表示企业产出水平,如果企业具有图7-4的左半部分所描述的典型的U型成本曲线, 那么我们认为是负的,是正的。另一个例子,考虑这样一个模型,把雇员年收入作为每个员工的年龄和许多其他度量生产率的变量,如教育的函数。年龄对收入的预期影响有多大?随着一个年轻员工年纪变大,他或她的收入会典型地增加。然而,超过某一点后,年龄的增长根本不会增加收入,在退休年龄附近,我们认为收入随着年龄开始急剧下降。结果,收入和年龄间的逻辑关系可能看起来有些像图7-4的右半部分;收入随着年龄的增加而增加,继而保持不变,然后下降。这种理论关系可以用一个二次方程来建立模型: (7-12)和的预期符号如何?随着员工年纪变老,由于“”会变得相当大,所以“”和“”间的差距会急剧增加。结果,“”的系数在较低年纪比在较高年纪更重要。反过来,“”的系数在较高年纪时更重要。由于你预期年龄的影响是先增加后下降,因此你会认为是正的,是负的(在其他条件相同时)。的确,这正是许多劳动经济学研究者已经观察到的现象。见原书P217图7-4 多项式函数二次函数形式(带平方项的多项式)依赖系数值(保持不变),表现U型或倒U型。左面显示用来表示典型成本曲线的二次函数形状;右面描述了(自变量对应变量,译者注)的影响先上升后下降(如年龄对收入的影响)。关于多项式回归,单个回归系数的解释变得困难了,对于X的特殊值域,方程可能产生并非想要的结果。例如,在X的某一区间内,三次多项式的斜率可能是正的,然后在下一区间变成负的,然后又变成正的。除非理论需要这种关系,否则使用高阶多项式是不恰当的。甚至如方程(7-10)中的二次多项式,假定一个特殊的形状(U型或倒U型)在某些情况下可能是不合理的。例如,回顾5.4节的雨量方程,那里很明显,平方项加进来仅仅是为了对这个公认的捏造方程提供更好的拟合。为了避免这种曲线拟合,在使用多项式回归方程时,我们必须非常小心以确保函数形式达到研究者的设想并且没有累赘。实质上在样本范围内,多项式形式仅仅被认为是对一般函数形式的一个逼近。7.2.5 逆形式逆函数形式把Y作为一个或多个自变量(在下面情况中是)的倒数(或逆函数)的函数: (7-13)如随着某个特定自变量趋向于无穷,该变量的影响被认为接近于零时,我们就应该使用反函数形式(或倒数函数形式)。要明白这点,注意随着变大,它对Y的影响减小。方程(7-13)中,不能等于0,因为如果等于0,令它去除任何数会导致结果无穷大或无定义。关于的斜率是: (7-14)的斜率分两种情况,如图7-5所述:1.当为正时,的斜率是负的并随着增加其绝对值减小。结果,保持不变,和之间的关系随着的增加(忽略误差项)而趋向于。2.当为负时,和之间的关系交轴于并且朝着为正时所逼近的同一条水平线(叫渐近线)向上倾斜。见原书P219图7-5 反函数反函数(或倒数函数)形式表示随着在数值上的增加,它对Y的影响趋近于0。根据符号的不同,反函数从上方或者下方趋向于同一个值(渐近线)。倒数函数或逆函数被应用于经济理论和现实世界的许多领域。例如,曾经流行的菲利普斯曲线,反映失业率和工资百分比变化间的非线性关系,该方法假定工资百分比变化(W)与失业率(U)是负相关的,但是超过某一失业水平后,由于制度或其他原因,失业率的进一步增加不再减少工资增加的水平。这种假定可以通过逆函数形式来检验: (7-15)用OLS估计该方程得到如下结果: (7-16) (0.0590) t =3.20 = 0.397这表明W和U以近似于假定的方式相关(为正时如图7-5所示),但是这并没有证明逆函数形式是描述这个特定理论的最好形式。有关这个例子的更多内容,参看练习5。7.2.6 选择函数形式为回归模型选择函数形式的最佳方法是,选择与方程的潜在理论相匹配的模型设定。在大多数情况中,线性形式足够了,对余下的大多数情形,常识将会在前面所概括的各种备选函数中非常容易地做出选择。表7-1包含了对各种备选函数形式的性质的一个总结。表7-1 备选函数形式总结函数形式 方程(仅有一个X) 的含义线性函数 Y关于X的斜率双对数函数 Y关于X的弹性半对数函数(lnX) 原书此处(220页)误写为,译者注。 对于X增加1%,Y改变的单位半对数函数(lnY) 对于X增加1单位,Y变化的百分比多项式函数 大致上对较小的X,Y关于X的斜率反函数 大致上对较小的X,Y关于X的斜率的相反数7.3 滞后的自变量事实上到目前为止,我们所研究的所有回归在本质上都是“瞬时”的。换句话说,模型所包含的是同期的自变量和应变量,如: (7-17)方程中下标t用来表示某一特定时点。如果所有变量都有相同的下标,那么方程就是瞬时的。一些初期的研究者在选择他们的自变量时,匆匆做出错误结论:所有回归应该遵从方程(7-17)的形式,仅仅包含来自同期的变量。这一结论忽略了这样一个事实:并不是所有经济或贸易情形都隐含有自变量和应变量之间的这种瞬时关系。许多情况下,我们必须考虑自变量的变化与这种变化所导致的应变量的变化之间的时间跳跃的可能性。在原因和结果之间的时间长度就叫做时滞。许多计量方程包含一个或多个滞后的自变量如,这里下标t-1表示的观测值是来自时期t的前一期,如在以下方程中: (7-18)在这个方程中,已被滞后一期,但是Y和之间的关系仍是同期的。例如,考虑农产品供给的决策过程。由于农产品生长需要花费时间,在产品实际供给消费者的几个月(如果不是几年的话)之前,人们必须决定多少英亩用来种植或者多少蛋用来孵化产蛋的母鸡(而不是立即卖掉鸡蛋)。农产品市场的任何变化,例如价格上涨使得农民通过提供棉花而受益,对该产品的供给具有滞后效应: (7-19)式中 t年的棉花供给量;t-1年的棉花价格; t年的农场劳动价格。注意上述方程假定棉花价格和棉花产量之间的时滞,而不是农场劳动价格和棉花产量之间的时滞。我们有理由认为,如果棉花价格发生变化,由于棉花的种植与生长需要时间,农民不能立即做出反应。滞后变量的回归系数的含义不同于非滞后变量的系数的含义。滞后X的系数估计值度量了由于去年X的一单位增加所引起的今年Y的变化(保持方程中其他X值不变)。因此,方程(7-19)中保持今年农场劳动价格不变,度量了去年棉花价格增加一单位所引起的今年棉花产量的单位增加量。如果假定发生超过一期的滞后结构,或者如果方程右边包含滞后的应变量,问题就明显变得更加复杂了。这些情况叫做分布滞后,将在第12章中加以处理。7.4 使用虚拟变量在3.1节,我们介绍了虚拟变量的概念,定义为根据本质属性如性别而取值0或1的变量。在那一节,我们仅仅关注截距虚拟变量的使用,依赖于定性条件是否被满足而改变常数项或者截距项的虚拟变量。这些变量采取一般形式: (7-20)式中 如图7-6中所见,截距虚拟变量依靠D的取值确实改变了截距,但是无论D取何值,斜率仍不变。注意即使我们反过来定义虚拟变量,即如果满足某一条件则D=0,反之D=1,这也是对的。但斜率仍就保持不变。注意在这个例子中,即使有两个条件也仅仅使用一个虚拟变量。这是因为建立的虚拟变量要比条件少一个。未由虚拟变量详细表述的事件,即被省略的条件,构成与所包含的条件进行对比的基础。因此,对于两个条件仅仅引入一个虚拟变量作为自变量,其系数解释为被包含的条件相对于被省略条件的影响。有关虚拟变量系数含义的例子,让我们看一下大学生联谊会/大学女生联谊会会员与平均成绩点数(GPA)之间关系的一个研究。大多数非计量经济学者会通过计算大学生联谊会/大学女生联谊会(所谓的学生会成员)成员的平均成绩并把他们与非成员的平均成绩进行比较来研究这个问题。然而,这一技术忽略了平均成绩差异可能与学生会成员以外的其他特征有关的可能性。见原书P223图7-6 截距虚拟变量如果增加截距虚拟变量()到方程中,对于虚拟变量所设定的两种定性条件,方程图形会有不同的截距。两个截距之间的差为。对于定性条件,斜率是固定的。相反,我们想建立回归模型来解释大学生的GPA。自变量不仅包括学生会成员而且包括其他学术表现的预测元,如随机资质测试(SAT)成绩和高中成绩。然而,由于社会组织成员是一个定性变量,因此在回归方程中,我们必须构造一个虚拟变量来从数量上表述大学生联谊会或大学女生联谊会会员:如果我们收集本班所有学生的数据,估计上述方程,得到: (7-21)= 0.45 N=25式中 第个学生的累积大学GPA(4分制);第个学生的累积高中GPA(4分制); 第个学生获得的最高口语和数学SAT成绩的总和(最高1600)。方程(7-21)中估计系数的含义是非常明确的。请暂停一下,你们自己指出来。其含义是什么呢?对于本例,估计值表示保持SAT成绩和高中GPA不变,大学生联谊会/大学女生联谊会成员的GPA比非成员的要低0.38。因此,人们预期大学生联谊会成员比非成员的GPA差大约1/3点。为了更好地理解这个例子,试着用方程(7-21)来预测你自己的GPA;预测的GPA与实际值有多接近?然而,在你匆忙退出你所在的社会组织前,请注意这个样本是相当小的,我们必然从方程中忽略了某些决定学术成就的重要因素。结果,我们不应迅速下结论大学生联谊会成员是愚蠢的。就此而言,我们已经用虚拟变量来表示那些仅有两种可能的定性变量(如性别)。定性变量有三种或者更多种选择的情形会怎么样?例如,如果你试图度量教育对薪水的影响,并且想要区分高中毕业生与农学学士(B.A.)和工商管理硕士(M.B.A.)获得者的薪水,该怎么做呢?答案当然不是令MBA=2,BA=1,其他为0,因为我们没有理由认为获得M.B.A.的影响正好是获得B.A.的影响的两倍。如果不是那样,那么会是怎么样呢?答案是定义比所有选择少1的虚拟变量,并用每个虚拟变量仅仅表示一种可能的条件。例如,在薪水例子中,你应该构造两个虚拟变量,第一个等于1,如果雇员有M.B.A.学位(否则为0),第二个等于1,如果雇员的最高学历是B.A.(否则为0)。像先前那样,令两个虚拟变量都等于0来表示省略的条件。这种方法你可以独立衡量每种学历的影响,而不必把获得M.B.A.的影响和获得B.A.的影响联系起来。应该避免使用只有一个观测值取1而其余观测值都取0(或相反,即虚拟变量只有一个观测值取0,其余观测值都取1,译者注)的虚拟变量,除非理论需要这种变量。这种“一次性虚拟变量”的作用仅仅为了消除数据集中的一个观测值(对应虚拟变量取0的观测值,这是针对虚拟变量只有一个观测值取0,其余观测值都取1而言,原文此处有误,译者注),进而通过设定这种虚拟变量的系数等于那个观测值的残差,可以人为地提高拟合优度。如果那个观测值被恰好删除,人们会得到其余系数的精确的相同估计值,但是, 删除这样的观测值很少(即使曾经有过)是恰当的。最后,虚拟变量可以作为应变量;这种可能性由第13章整章来讨论。7.5 斜率虚拟变量直到现在,本书每个自变量都仅乘以一个其他项,即斜率系数。为明白这点,再看一下方程(7-20): (7-20)在这个方程中X仅被乘以,D仅被乘以,并不含有其他因子。这种限制不适用于一种叫做交互项的新变量。交互项是回归方程中的自变量,是两个或多个其他自变量的乘积。每个交互项有它自身的回归系数,因此最后结果是交互项有三个或多个组成部分,如。当Y关于某一自变量(此例中为X)的变化依赖于另一自变量(此例中为D)的水平时,应使用这种交互项。运用不含虚拟变量的交互项的例子,请看练习14。交互项的最频繁应用是构造斜率虚拟变量。斜率虚拟变量允许应变量和自变量之间的关系的斜率是不同的,这种不同取决于虚拟变量所设定的条件是否被满足。斜率虚拟变量与截距虚拟变量不同,当特定条件被满足时,截距虚拟变量改变的是截距项,而不改变斜率。实践中,斜率虚拟变量有许多现实的运用。假定自变量对应变量的影响只要在满足某种定性条件时就会变化,我们就应该使用虚拟变量。例如,估计重大战争时期的消费函数。战争必然会减小边际消费倾向,这种变化可以用斜率虚拟变量来建立模型,在战争年份虚拟变量取一个值,在非战争年份,虚拟变量取另一个值。通常,斜率虚拟变量的引人是通过给方程增加一个变量,这一变量是你想改变斜率的自变量与引起这种斜率变化的虚拟变量的乘积。斜率虚拟变量方程的一般形式是: (7-22)注意方程(7-20)与(7-22)之间的区别。除了我们增加一个由自变量与虚拟变量相乘的交互项(),方程(7-22)与方程(7-20)是一样的。在消费函数的例子中,Y是消费,X是可支配收入,D度量了第年是否为战争年。让我们核实一下,如果D变化,Y关于X的斜率确实发生变化:当D=0时,当D=1时,实质上,当D设定的条件得到满足时,X的系数发生改变。为明白这点,将D=0和D=1分别代入方程(7-22),算出X的系数。注意方程(7-22)既含有斜率虚拟变量也含有截距虚拟变量。这一设定表明,无论何时使用斜率虚拟变量,为了避免在估计斜率虚拟变量的系数时出现偏差,在方程中包含和是重要的。除极为罕见或强行排除(,译者注)的情况外,应该使用这种设定形式。如果方程中还有其他X项,他们不应与D相乘,除非你假定他们的斜率也随着D而变化。让我们考察一下图7-7,该图既有斜率虚拟变量又有截距虚拟变量。在图7-7中,当D=0时截距为,当D=1时截距为。另外,Y关于X的斜率在D=0时为,在D=1时为。结果,实际上有两个方程:如图7-8中所见,带有斜率和截距虚拟变量的方程根据系数的符号和绝对值的不同可以呈现出许多不同的形状。结果之一,斜率虚拟变量可以用来建立各种关系的模型,但是在假定不同的虚拟变量的系数值时,非常具体的定义(虚拟变量)是必要的。见原书P227图7-7 斜率和截距虚拟变量如果方程中增加斜率虚拟变量项()和截距虚拟变量项(),根据虚拟变量所设定的定性条件的取值,方程的图形有不同的截距和斜率。两个截距之间的差为,而两个斜率之间的差为。例如,考虑男性和女性之间收入差距的问题。虽然对这

    注意事项

    本文(2019第7章设定-选择一个函数形式FF.doc)为本站会员(上海哈登)主动上传,三一文库仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。 若此文所含内容侵犯了您的版权或隐私,请立即通知三一文库(点击联系客服),我们立即给予删除!

    温馨提示:如果因为网速或其他原因下载失败请重新下载,重复下载不扣分。




    经营许可证编号:宁ICP备18001539号-1

    三一文库
    收起
    展开