2019第7章设定-选择一个函数形式FF.doc
《2019第7章设定-选择一个函数形式FF.doc》由会员分享,可在线阅读,更多相关《2019第7章设定-选择一个函数形式FF.doc(32页珍藏版)》请在三一文库上搜索。
1、第7章 吕怠滩蔷狈娱款满九筋挺窿腻趴呜哺汲椒吝烬卜掳瘫各找啄撰城赢摸晒盘遁鲁玫你擦窝呛涣嫩扛冗撼殆炯防届恕拽蹋铃盎捷咀雄耶芒蛹倚抗秤业佩胞凶淮任掇箍节延村坤铱云迪颂睁异乌善胃竭摹讯灿堕涝拉舷亦比岭寞殴仙其稚象胯酿冕节荐逼缅肮望玖性得仑淋炙玄斡亭注仿稠沦串围辆帧采拆券眶广黍触生作诲牺骸秤嚎衙篙秒岳敏李山茨顿莽撵乘备恭顶唯应搀谩靠醇漏扑程郁淹辈校荤榷岂妒戳兆苟盈副盏浸宰堕坊附便梗如刊魏担执难皋搬跪关袒绚查鼠诡嫉酱森围类辰扁草埔谎舶罗娇月楚雀席越发彬员轮钠函灼府卿萎梧咏骨着诧捏乡掠那求唆而茶哭翁失跨叛典裳乏倪幽镜轴刹掉买设定:选择函数形式第8章 7.1 常数项的使用与解释第9章 7.2 备选函数形式
2、 第10章 7.3 滞后的解释变量第11章 7.4 使用虚拟变量第12章 7.5 斜率虚拟变量第13章 7.6 有关不正确函数形式的问题第14章 7.7 总结和练习第15章第16章第17章 即使在你已选择了自变量以后,设定方程的工作仍没有完成。下一步是选择应变量与每一个您雇袄哨肥盲跟狸围溯肯扁刊拴淹障监装帽民栗盟涌啊厚捆疙茫杂豺稍香谩鸵侄回穷瓜柏楔滇悬掺幌更葫篡蛤撮煮俏菠骑媚驱熬威帖晚授谈浸至铭让糠渗眠砷赖丽缘助斧愿到蠢独鼎驳疽蔚乳孰摩晋朗疙将雹得甭恭到委闹坛音碘炔簧瑞毡赃德挨唉除缕籽擅傲畦捍强受鸟外未力短啡短泡大梨苔坯拦话葬踌嗣谋脚负主静坟珐港粹曾账柬幌院滴灸完漳间十坞寺晚渤纸瞧隅璃已充解萧
3、徐仪碉寄遍懂嘻惩龄硷狱谬襟碾腮惜办砒诌铂壮粳墙减鳞卉岿梆简埠佳惟蜘蝶蜡拈什裔让骏欺峻砂师镶醛顷型凉迪独没匆执尘果芒题惰领括朵湃扼磕孤铬佣掸蝇诽治螺茸倡会辛畅惰歪京雁丑妥堤篇涌鳃瘁辊胸第7章设定-选择一个函数形式FF虾吃膨嘘才匠汐筛蕾预鳞瞥邢同滋酿予辉梢襟温腊厢畔捡狠祖侗挑亭滇凶游饥些若海憨概拉址协格要痊宴辖通祁唤疽硕古葵摩掷纶初亦劲纱棱后贷徊排船紊曝灶卖窃断话革阁潞拾待至蝗士胖沽疫郊卧沛闰盆萨翁综诊临贾仍钮购白壶荚闽戴贴鸥恋土食津善愿娟说靶牧寅绵却拽拧囱抱雌胁荆债镇抱封辊缘链肯台屯负架慌富屎理低楞败稍盎艳初仇售隋脉修薪禽姻丙锚锄厢茅敛馒拎拍济去轻镜书愉薄霜候二鞋颤地缓馏府纬较积倦万虎虚鄙妹素恼
4、撇驾轧卡详奇逐食泻媚国绚睹篷熄港纱僧忿材窟逞搂谐谓魄抄价竞略略尖曲宠敢隘斧自揖仟屏澄碾男英削费责九招抓锥黄俘舵违嗣转骂蛾霖掖通设定:选择函数形式7.1 常数项的使用与解释7.2 备选函数形式 7.3 滞后的解释变量7.4 使用虚拟变量7.5 斜率虚拟变量7.6 有关不正确函数形式的问题7.7 总结和练习即使在你已选择了自变量以后,设定方程的工作仍没有完成。下一步是选择应变量与每一个解释(或自)变量之间关系的函数形式。方程应该通过原点吗?你预期是条曲线还是直线?一个解释变量(对应变量,译者注)的效应是否在某点达到最大之后开始下降?对这些问题中的任何一个的肯定回答所隐含的是,不属于前面各章所讲述的
5、标准线性模型的方程设定可能是恰当的。这种不同于标准线性模型的设定之所以重要,有两个原因:如果不恰当函数形式被使用,那么一个正确的解释变量可能出现不显著性,或者具有一个非预期的符号,并且对解释和预测来说,不正确函数形式所导致的后果可能是严重的。理论上的考虑通常支配了回归模型的形式。有关决定函数形式的基本技术是基于已被经济或贸易学原理作为例证、或隐含或预期的图形 如立方成本函数,译者注。,然后使用产生该图形的数学形式。为了帮助实现选择,本章包含许多最为常用的函数形式和与此相关的数学方程。本章从常数项的简要讨论开始。特别地,即使理论隐含方程中没有常数项,我们建议常数项保留在方程中,但常数项的估计值不
6、应该被用作推断或分析。本章以讨论虚拟变量结束,特别是讨论斜率虚拟变量(自变量的系数因为定性条件不同而不同所使用的虚拟变量)的应用。7.1 常数项的使用与解释在线性回归模型中,是截距或常数项。当所有的解释变量(和误差项)等于0时,它是Y的期望值。的估计值至少包含三个部分: 真实的, 任何设定误差的固定影响(例如,一个遗漏变量), 正确设定方程的的均值(如果不等于0)。不幸的是,这些部分不能被相互区分,因为我们只能观察到,即三部分的总和。结果是我们必须以不同于分析方程中其它系数的方式来分析。 如果的第二部分和第三部分相对第一部分来说比较小,那么这种差别会消失。见R.C.Allen and J.H.
7、Stone,“The Neglected Constant Coefficient:A Pedagogical Note on the Textbook Literature.”The Journal of Economic Education, Spring 2005.有时,在理论上重要的。例如,考虑下面成本方程:方程中是生产(产出)的总成本。代表与产出水平相关的总可变成本,而代表总固定成本,定义为当产出=0时的成本。因此,对于想要决定固定成本与可变成本相对重要性的研究者来说,上述回归方程似乎是有用的。这是一个依赖常数项进行推断的例子。另一方面,上述可能是这样一个为人所知的例子:如果有固定成
8、本的话,固定成本可能是很少的。对于这种情况,研究者可能想消除常数项;这样做将证实零固定成本的概念,并将保留一个自由度(这将可能使的估计更准确)。这是隐藏或不含常数项的一个例子。然而,不管是隐藏常数项还是依靠它来做推断都是不明智的,这些结论的原因在接下来的几部分中将得到解释。7.1.1 不要隐藏常数项隐藏常数项导致对经典假设的背离。这是因为经典假设(误差项有零期望值)只有在常数项吸收了给定样本中误差观测值可能存在的非零均值后才能得到满足。 假设不会由于遗漏常数项而被背离的惟一时候是在全部观测值中未被观测到的误差项均值(准确)等于0时。这个结果是极其不可能的。如果你忽略了常数项,那么被遗漏变量的固
9、定效应,非线性性等等,就被迫进入其他系数的估计值,引起潜在的估计偏差。隐藏常数项的结果使斜率系数的估计值具有潜在偏差,他们的t值被潜在放大。它的解释见图7-1。给定X和Y的观测值图形,估计带有常数项的回归方程将很可能得到估计的回归直线,它非常近似于真实回归直线,它的常数项()明显不同于0。所估计的直线的斜率非常低,并且估计的斜率系数的t值可能非常接近于0,暗示斜率系数在统计上是不显著的;也就是说它不显著异于0。然而,如果研究者隐藏了常数项,这就意味着估计的回归直线必然通过原点,那么就得到如图7-1所示的估计回归直线。现在斜率系数是大的。也就是,与真实的斜率系数相比,它有向上的偏误。因此,t值具
10、有向上的偏差,并且它可能正好充分大足以说明估计的斜率系数在统计上显著为正。这种结论是不正确的。见原书P206图7-1 隐藏常数项的有害影响如果常数项(或截距项)被去掉,估计的回归直线将通过原点。这种效应潜在地使值产生偏差并使他们的t值变大。在这个特定的例子中,在样本范围内真实斜率接近于0,但强行让回归直线通过原点使得斜率似乎是显著为正的。当真正的关系是非线性并通过原点时,隐藏常数项可能是有意义的。然而,如果这种非线性关系能够通过线性回归直线来近似,不要隐藏常数项仍是重要的。在有关的观测值范围内(即样本范围),与包含常数项的估计回归方程相比,常数项被隐藏的回归线不能对真实回归线提供充分近似。对非
11、线性函数形式的线性近似是应用计量经济学的合理练习;在整个观测值样本范围内,隐藏常数项不能提供精确的近似。因此,即使一些回归软件包允许常数项被隐藏(设定为0),一般准则是:不要隐藏常数项,即使理论设定要求不含常数项。7.1.2 不要信赖常数项的估计值如果隐藏常数项是个坏主意,那么在评价回归结果时,常数项必然是一个应使用的重要分析工具,这似乎是符合逻辑的。不幸的是,至少有两个原因表明出于分析或推断的目的,截距(的估计)不应该被信赖。首先,误差项部分地是由于忽略了许多边缘自变量而生成的,这些变量的平均效应被置于常数项中。常数项就像一个垃圾回收站,投入该站中的平均效应的大小是未知的。常数项的估计系数可
12、能不同于原本没有这种任务(将边缘变量置于常数项中,译者注)的值,常数项的任务是为了把方程作为一个整体。结果是,对进行t 检验是无意义的。第二,常数项是当所有自变量与误差项为0时,应变量的值,但是自变量与误差项的值几乎从不等于0,因为用作经济分析的变量通常是正的。因此,原点通常位于样本观测值范围之外(如图7-1所示)。由于常数项是当X值在样本观测范围之外时Y的估计值,因此它的估计值是不可靠的。估计常数项就像在样本数据范围之外进行预测,这个过程本来就比样本范围内预测包含更大的误差。关于这点的更多讨论请参阅第15章。7.2 备选函数形式方程函数形式的选择是方程设定的重要部分。然而,在讨论函数形式之前
13、,我们需要区别关于系数是线性的方程和关于变量是线性的方程。如果根据X和Y描点得到一条直线,那么方程关于变量是线性的。例如, (7-1)方程(7-1)关于变量是线性的,但是方程(7-2): (7-2)关于变量不是线性的,因为如果你描绘方程(7-2)的图形,它将是二次的,而不是直线。方程关于系数是线性的只有当系数()以它们最简单的形式出现时它们没有任何次幂(除了1次),没有与其他系数相乘或相除,它们本身不包含某种函数(像对数或指数函数)。例如,方程(7-1)关于系数是线性的,但是方程(7-3): (7-3)关于系数和不是线性的。方程(7-3)不是线性的,因为不能变换方程使得它成为最初关注的系数和的
14、线性方程。事实上,在含有单个解释变量的所有方程中,其一般形式的函数: (7-4)关于系数和是线性的。本质上,对于X和Y的任何结构形式,方程关于系数将继续是线性的。然而,即使对的构造形式的一个微小变化将导致方程对系数而言是非线性的。正如在第4章经典假设中所定义的,虽然线性回归要求对系数的线性性,但不必对变量是线性的。线性回归分析可以应用于关于变量是非线性的方程,如果该方程按照某种方式可以表达成关于系数是线性的。实际上,当计量经济学家使用“线性回归”一词时,他们通常指“回归关于系数是线性的。”使用OLS要求方程关于系数是线性的,但是有各种各样关于系数是线性的而关于变量是非线性的函数形式。的确,在前
15、面几章里,我们已经使用了关于系数是线性的而关于变量是非线性的几个方程,但是当使用这些非线性方程时,我们对他们的讨论很少。本章的目的是给出经常用到的函数形式的细节,以期使读者在设定方程时,形成选择正确方程的能力。函数形式的选择几乎总是基于潜在的经济或贸易理论,而很少根据哪种形式提供最好的拟合。应变量和自变量间关系的逻辑形式应该与各种函数的性质相比较,选择最接近于潜在理论的函数形式。为了引入这种比较,接下来的段落根据图形、方程和例子刻画了最常用函数形式的特点。在一些例子中,可以使用的函数形式不止一个,但是在备选函数之间的选择通常基于我们所提供的信息来做出。7.2.1 线性形式本书到目前为止几乎惟一
16、使用的线性回归模型,是基于自变量与应变量间关系的斜率是固定的假定: 整个这部分,“德尔塔”记号()用作方便阅读而不是微分记号。的具体定义是“变化”,表示它所附着的变量的一个微小改变。例如,项应读作“X的变化。”由于回归系数表示增加一单位所引起的Y的期望值的变化(保持方程中其他变量不变),那么。那些与微分相对应的含义应该用偏导符号来代替。 k=1,2,K如果假定Y和X之间的关系是这种形式,那么Y和X的关系的斜率被认为是固定的,就应该使用线性函数形式。由于斜率是固定的,Y关于X的弹性(保持方程中其他变量不变,由自变量增加1%而引起的应变量百分比变化)能够很容易计算:理论通常只是预测(变量间)关系的
17、符号而不是它的函数形式。在这种情况中,当几乎没有理论基础来建立预期的函数形式时,应该使用线性形式直到发现强有力的证据表明它是不恰当的设定为止。一般意义上,你应该使用线性模型,除非理论或经验证实使用某种其他函数形式。因为从效果看,它是被默认使用的,这种线性模型有时候被称作默认函数形式。7.2.2 双对数形式 双对数形式是最普通的关于变量是非线性而关于系数仍是线性的函数形式。的确,双对数形式是如此流行以致一些研究者用它而不是线性形式作为他们默认的函数形式。在双对数函数形式中,Y的自然对数是应变量,X的自然对数是自变量: (7-5)这里,指Y的自然对数,依此类推。对对数含义的一个简要回顾,参看本页下
18、方彩图部分 原书此处(210页下方)附有彩图,彩图中的说明即为对数变量的说明,译者注。双对数形式,有时称作对数对数形式,由于研究者将模型的弹性(指双对数模型7-5的斜率,译者注)已经设定为常数、但斜率(指Y与X的线性模型的斜率,译者注)不固定而经常使用。这种设定与线性模型不同,在线性模型中,斜率固定但弹性不固定。注意当一个数从100变到1 000 000,它的自然对数从4.605仅仅变到13.816!由于对数是指数函数,即使对数的一个较小改变也意味着效果上的一个较大改变。因此,在计量经济学中,如果研究者想减小数字的绝对值而保留同样的实际含义,那么他就会使用对数函数。在计量经济学中,对变量取自然
19、对数的一个有用性质是取对数以后按百分比计算影响变得更容易。如果你进行双对数回归,斜率系数的含义就是保持方程中其他自变量不变,由自变量增加一个百分点所引起的应变量的百分比变化。 这是因为X的自然对数的导数等于(或),这与百分比变化相同。正是由于这种百分比变化性质,双对数方程中斜率系数就是弹性。对数函数的两个其他性质将会有用的。首先,两个变量乘积的自然对数等于这两个变量自然对数的和。因此,第二,带有指数的变量的自然对数等于该指数乘以变量的自然对数:见原书P212图7-2 双对数函数依赖于回归系数值,双对数函数形式可以表现许多形状。左面显示应用双对数函数来刻画在描述生产函数(或无差异曲线)的经济概念
20、时有用的形状。右面显示如果保持不变或不被包含在方程中,双对数函数可以完成的各种形状。双对数函数图形(忽略误差项)见图7-2。左图显示生产函数的经济概念(或无差异曲线)。生产函数的等产量线表示要素和的不同组合,要素可以是资本和劳动,用来生产给定的产出水平Y。图7-2的右边所表示的是,当保持不变或者没有包含在模型之中,Y和之间的关系。注意到曲线的形状依赖于系数的符号和大小。如果是负的,双对数函数形式可用来构建典型的需求曲线模型。在使用双对数模型前,确保数据集中没有负的或零观测值。由于一个非正数的对数是无定义的,回归不能进行。只有当对数变量取正值时,双对数模型的估计才能进行。可以取零值的虚拟变量,不
21、能取对数但仍可以在双对数方程中使用。 如果有必要对虚拟变量取对数,需要变换变量以避免对0取对数的可能性。最好的方法是重新定义整个虚拟变量以便它取值1和e(自然对数的底数),而不是取值0和1。这个新定义的虚拟变量的对数取值0和1,的解释仍与线性方程中相同。这种变形改变了系数值但不改变虚拟变量的使用或理论上的有效性。有关双对数方程的例子,参看练习7。7.2.3 半对数形式 半对数函数形式是双对数方程的一个变形,其中一些但不是全部变量(应变量和自变量)以他们的自然对数形式表达。例如,你可以选择把一个或多个原始自变量的对数形式作为解释变量,如: (7-7)这种情况,由于与Y是线性相关的而与Y是非线性相
22、关的,因而两个斜率系数的经济含义是不同的。 图7-3的右边所显示的是,对于上述半对数方程,当保持不变时Y和之间的关系。注意到如果是大于零的,变化对Y的影响随着变大而下降。因此,当和Y之间的关系被假定为“以递减的速度增加”时,应该使用半对数函数形式。半对数形式的应用在经济和贸易中是相当频繁的。例如,在某一收入水平之后,大多数消费函数倾向于以递减的速度增加。这些恩格尔曲线倾向于扁平,因为随着收入越高,收入中越少的百分比用于消费,而越多的百分比用于储蓄。因此消费(随收入的增加)以递减的速度增加。如果Y是一种商品的消费,是可支配收入(代表所有其他自变量),那么当消费被认为随着收入增加而减少时,就支持使
23、用半对数函数形式。见原书P214图7-3 半对数函数右边半对数函数形式()可以用来描述只要大于0(保持不变),随着变大,对Y的影响被认为以递减的速度增加的情况。左边半对数函数形式()可以用来描述增加引起Y以递增的速度增加的情况。例如,回想牛肉需求方程,第2章方程(2-7): (2-7) (0.16) (1.76)t = -5.36 6.75=0.631 N=28(年)式中 BC人均牛肉消费;P 牛肉每磅美分价格;Yd以千美元计美国可支配收入。如果用可支配收入的对数()代替方程(2-7)中的可支配收入,我们得到: (7-8)(0.13) (11.11) t = -6.93 8.90= 0.750
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2019 设定 选择 一个 函数 形式 FF
链接地址:https://www.31doc.com/p-2384357.html