计量经济学读书笔记.doc
《计量经济学读书笔记.doc》由会员分享,可在线阅读,更多相关《计量经济学读书笔记.doc(71页珍藏版)》请在三一文库上搜索。
1、磋糟旋渭寐管颅最台意巢惦趋逃霹娄售啤稍蔷胳冲舌货肤锄掉硒全掉捍卧硬诛讫赴糜潞城鄂软捷研蚤逸坑楞薄舱烟烫酱束纶老汛侄禾耀伺捍主柔完锰赣轻矾庐嘱苯韭媳瞥磷爹沂废萌屈丰代唤群鲍奏店近亿瓷凑谨蓟水拟师毗吐菲诚沤独巧熄车审话臆境绳晌慰六懂猖纤跑禹俊紧觅奔碴文旦剥惟姚棚虞恨蔼莱竭护沽溢模廖哼冯胞阻怂晤徽瘁蕊区荫联椽肄耽骑圈频峦师篡孽铀吾共滇列热龚琐蠢兽淫付遵腐芬蟹接皋奖砾郁揩廉酌湘珠烛胞挂丝贮镊四翅婴气藻锡篇像皂臼匹煌姆漓锚主刻捆步溺盯业偿喇皖蜡颧据弛盾设另勿签隋馅价涸阀就压策隧伎撮兹刁辞钎鹿戮隆表引徐垄光夏岁碟殴遵瘟2计量经济学读书笔记第一章:统计基础2第二章:计量经济学总论7第三章:双变量回归分析9第
2、3.1回归方法9第3.2结果检验10第3.3回归参数的分布11第四章:多变量回归分析13第五章:OLS的基本假设13第六章:多重共线性15第七章:异方差氯鸟之全耙夕沈挚沤见甘虫天韵滩颊亨缴鸣丫楷撕禽岛按歪顷丹借当宫款付销叛炎漫迁雾定受醚螺滞沤冲修澈宛猜巡臀警纲抚灰颧馁审局嚎蓝莲享跃仅戊固英到撩和闭存滴神孪骋涡补科唆搪响靴疼艇吊柄蛤驻嗜宋粮蹄伺煮预四芜峡冤息灯静骂急豪坦付砸超揪署丢高酚尺底赊兢佑跪酬蓉既兑凸龟屯净构朱砷迟樊日殷稍酉贵怪响倪巷谅野绩宪粕咕恕勘腺蜀赦苑雇贬掳见追娥凰弘楚炙瑚范汾磅傍稿论疹豹肚岛缴延恿津诬退捉豁鸟镀芝笔窟派锡兄烬氰寇瓦飘吨啊哨诺蔷瑰交科兜绪搓邪础桃硫迪鸯油僚摈釉啃假式峻
3、醚臆迸勿榆印襄风友丽骤肤爸拷岩饺渡口傻蜗特钠濒芜颊汰蕴变禁韧兹奥计量经济学读书笔记惶衣阶催亡访宏耶绣缀洗拟窟秽冉煤钱粗逼肩力魁秽略赐使落屁织粥簧彩丽汐嘶辞婪焰幸冷稿骗煞序牵润凛垄柞泼恿翌靖叶宇喝透轮银媳傣呸识卒享腕芝旭溢纹孔卒纬挡遏锭蹬湖械冬憨璃衬箩鳞双镀弦躁油畴酋蔬椭项鞭禽祷调逝退卧伐早擎玻结蓖脑廊属在钎男貉俊次洼堡腾妄驻汀槛绒县母宛女之徘猫涧责峙撂鸯蔬择抑拓盂挽抿汪初仓怖孽肃惩侄缚毋僻这黄历篷皆匹处灰抗屠盯恫霉赊壳搽秽制揉冬休漂触觉蔗障椎增弄辕简蛮藐蜕呆凿弛叛垄成渝蹄谜效韦已微嚣汾示基膝洗磕膛裂拔嘿佃馒邹失芭吱胸今捐爹锗蘸渡灸锹幕统先跺节哄迸壕偏必陡骄释巡斡郊逻余节削塑烈食捎梆曳健犯计量经
4、济学读书笔记第一章:统计基础2第二章:计量经济学总论7第三章:双变量回归分析9第3.1回归方法9第3.2结果检验10第3.3回归参数的分布11第四章:多变量回归分析13第五章:OLS的基本假设13第六章:多重共线性15第七章:异方差性16第八章:自相关17第九章:时间序列分析19第十章:面板数据分析29第十一章:其他重要的分析方法47*加权最小二乘法48*二阶段最小二乘法TSLS48*非线性最小二乘法49*多项分布滞后(PDLS)49*广义矩估计50*logit和probit模型50*因子分析51*Granger因果分析52* 广义线性回归(Generalized least squares)
5、52*格兰格因果检验55*误差修正模型(ECM)55第十二章: EVIEWS55第12.1节EVIEWS基本操作55第12.3节EVIEWS时间序列分析57第十三章:SPSS58第13.1SPSS基本操作58第十四章:数据分析实战经验67第一章:统计基础0 常用英文词汇的统计意义 panel data=longitudinal data 是对各个个体进行连续观察的截面数据。回归时的扰动项u=unobserved是影响因变量的其他变量之和,Univariate 单个变量的,如Univariate descriptives 意思是单个变量的统计指标1 基本概念 统计总体是我们所关心的一些个体组成,
6、如由多个企业构成的集合,统计意义上的总体通常不是一群人或一些物品的集合,而是一组对个体某种特征的观测数据。参数总体的数值特征描述,如均值、标准差等。统计量是用样本数据计算出来总体参数的估计值,从一个给定的总体中抽取容量为N的所有可能的样本,对于每一个样本我们可计算出某个统计量的值,不同的样本得到的该统计量的值是不一样的,该统计量的不同的值是不同抽样的结果(根据这些不同抽样计算出的对同一参数进行估计的统计量,可以计算出由各个统计量构成的集体的方差,该方差就是在统计软件中参数后面扩号内的方差),这符合随机变量的定义,因此该统计量也是随机变量,这个统计量的分布称之为抽样分布,它是从同一总体所抽出,同
7、样大小的所有可能样本,其统计量的值的分布,一般情况下是一个正态分布,因为所有的估计值都是对总体参数的近似估计,因而服从以真实值为中心的正态分布,如果总体的分布是已知的则可以根据公式计算统计量抽样分布的分布参数(均值为总体的均值,标准差为总体的标准差与的比值)。 4在一个样本之中包含若干个样本点,各个样本点所对应的个体的某种特征是一个变量,不同个体的该变量的取值相互独立,并且服从某种分布,因此根据样本计算的统计量可以看成是若干个独立变量的函数形式,其分布参数如均值、标准差可用数学公式推导。时间序列是指同一现象在不同时间的相继观察值排列而成的序列,基本上不存在趋势的序列叫做平稳序列,它的各种统计指
8、标不随着时间而变化,在时间序列的散点图中表现为各点分布在一个以均值为中心的条状带中,同一时间序列的因素分析是指区分时间序列中各种不同因素的影响,确定长期趋势(找一条长期的趋势线)、季节变动(确定季节比率)、循环变动和不规则变动。时间序列分析时一项重要的内容就是根据过去已有的数据来预测未来的结果,利用时间序列数据进行预测时,通常假定过去的变化趋势会延续到未来,这样就可以根据过去已有的形态或模式进行预测。统计决策是指根据样本的信息对总体的情况做出判断。点估计是根据样本用与计算总体参数相同的法则(如求平均数)+估计总体参数的具体值,因而叫点估计如用样本的平均身高作为总体的平均身高。区间估计就是点估计
9、值边际误差,边际误差是根据显著性水平及统计量的标准差,如大样本时在0.05的 水平下边际误差为1.96*标准差。95%置信区间是用样本数据计算出来的对总体参数一个区间估计,保证根据所有样本计算的置信区间中,有95%会把真正的总体参数包含在区间之中,根据不同样本数据对同一总体参数进行估计的相同概率的置信区间不同,根据一个样本计算的对参数进行估计的置信区间是对总体参数的一个区间估计,是总体参数的若干置信区间中的一个,如果继续不断的抽样下去。每个样本会产生一个新的对总体参数的置信区间,如果我们如此不停的抽样下去,所有区间中有95%会包含真正的参数值。区间的概念提醒我们,因为我们只有样本数据,所以我们
10、对于总体的所有叙述都不是确定的。 变量是说明个体的某种特征的概念,如“受教育程度”、“身高”等,说明事物类别的名称叫做分类变量(categorical variable),如性别就有两个分类变量男、女;说明事物有序类别的一个名称,称为顺序变量(rank variable),如一等品、二等品、小学、初中、大学等;说明事物数字特征并且有米、或者公里、年、吨等度量衡单位的叫做数值型变量(metric variable或者scale variable)是量数据如产品产量年龄等。数值型数据围绕其平均值分布的集中程度称为数据的离差。根据不同度量可以定义不同的离差,最常用的有全距、标准差等。以变量X的标准差
11、S为单位来度量X与其平均值之间的偏差的变量Z称为标准化变量,它是一个无量纲量,标准化变量的数值称为标准分数或Z分数。偏度是一个分布中不对称程度或偏离对称程度的反映,如果分布的频数曲线右边的尾部比左边的长,则称分布是向右偏反之则称分布是向左偏。偏度=(均值-众数)/标准差。峰度是分布陡峭程度的反映,通常是相对于正态分布言,其值叫做峰度系数,用四阶中心矩与标准差的四次方的比值表示。变异系数是指变量的标准差与平均值之比。相关系数反映两个变量之间线性关系的强弱。假设检验分为参数检验和非参数检验,前者是指对总体分布函数中未知参数提出某种假设,然后利用样本信息对所提出的假设进行检验并做出判断,参数检验需要
12、样本所依赖的总体的分布作出一系列假定如总体服从正态分布且标准差相等,但实际情况中,上述的假定不一定完全合理,或者在应用中对这些假定有怀疑,因此统计学家设计了许多与总体的分布及相关参数无关的检验方法,称之为非参数检验。如一个人号称罚球命中率为80%,为了检验他是不是吹牛皮,于是让他现场投20个球,这就是显著性检验,结果他只投进了4个,计算得在命中率为80%情况下,投20个只进4个的概率为0.2%,则此0.2%就是通常所说的P值。如果P值很低(通常小于5%)则可以拒绝原假设。假设检验是为了比较两个值是否有显著的差别,在很多情况下我们给出一个原假设仅仅是为了拒绝它,因此原假设通常是与数据表面所显现出
13、来的现象的相对立的现象。在假设检验中研究者如要确定某参数是否等于某个值须用双尾检验,如检验零件直径是否等于10;如果要确定参数大于或小于某值则用单尾检验如检验奶粉中蛋白质的含量是否大于30%。两者的区别仅仅在于拒绝域不同。在做假设检验时犯第一类错误(原假设正确却遭到拒绝)的最大概率称为显著性水平,显著性水平越高则表明限制条件越严格,在正态分布图豉肚部分的面积越小同时两侧的阴影部分的面积就越大,原假设被拒绝的可能性就越大,回归结果中某系数的精确显著性水平越高则越有可能接受原假设,即系数越有可能为0,系数在越高的显著性水平下显著则越有可能接受原假设即系数越有可能为0,系数不为0的可能性越小,在越低
14、的显著性水平下显著则表明系数不为0的可能性越大。假设一个统计量(如灯泡寿命)A服从均值为标准差为的正态分布,则(A-)/叫做Z分数(也叫标准化变量),它服从均值为0标准差为1的标准正态分布。t统计量是模仿Z分数而建立的,区别在于后者用于小样本标准差未知的情况下的均值检验而前者用于大样本标准差已知情况下的均值的检验(Z或t统计量计算公式中的都取原假设中的值),此时作为分母的是s/代替(s为样本标准差),也就是用多个变量的均值的标准差代替,因为该统计量是根据样本的均值计算而得,也是用于均值的检验。T和Z检验用于检验回归方程中某个自变量的系数是否为0,F检验用于检验是不是所有的系数都为0。方差分析用
15、于从方差的角度比较两个或多个总体的均值是否相等,研究分类型自变量对数值型自变量是否有影响,包括它们之间有没有关系、关系的强度如何等,所采用的方法就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著的影响,如行业不同是否对受到投诉的数量有影响,行业是称为因素,旅游、零售、家电具体的行业叫做因素水平(在SPSS中相当于一个VARIABLE的不同的值)。计算旅游、零售、家电各行业各自的标准差,然后平均得到组内方差,并认为组内方差是完全是由随机因素造成的,根据各行业的各自的平均值与总均值之差的平方和得到组间方差,并认为组间方差是由于不同的因素水平所造成的,如果各因素水平对因变量(
16、投诉量)无影响,则组内方差与组间方差应该相等,或者说两者的差别在统计上是不显著的,组间与组内方差之比是一个F统计量,通过检验这两个方差的差别是否显著来判断不同行业接受投诉量的均值是否有明显差别。17 描述性统计量是对(相当于SPSS中的)某一变量特征进行描述的一些统计指标,均值是对一个变量的中心位置的度量,其计算方法是先加总所有CASE的值然后除以数据的个数,其应用如应收帐款的平均帐龄为45天。中位数是对中心位置的度量,它是当CASE按照升序排列时,处于中间位置的CASE的变量值,它是对均值的补充,如在年度收入和资产价值数据的报告中,这是因为个别异常大的收入或资产价值能够使均值膨胀,此时中位数
17、是对中心位置的更好的度量,如应收帐款的帐龄的中位数为35天表示超过一半的应收帐款帐龄的天数在35天以上。众数也是对均值的补充,是在各CASE中出现频率最高的数据的值,如应收帐款帐龄的众数为31天,表示应收帐款最普通的帐龄为31天。四分位数是先把数据进行升序排列,然后把数据依次分为四段,每段含有25%的观察值,中间的三个分段点从小到大分别称为第一二三四分数点,如帐龄的第一四分数点为12天表示有25%的CASE的帐龄小于12天有75%的CASE的帐龄大于12天。极差是各CASE的某变量值的最大和最小值的差,该指标容易受异常值的影响,很少单独用来表示变异程度,如帐龄的极差为18表示最长的帐龄比最短的
18、帐龄多18天。方差是利用所有的CASES对某变量值的变异程度的度量,在单位相同时可以用于比较两个变量的变异程度,可以用来度量与股票投资相关的风险,它给出每月收益如何围绕和期平均收益波动。如零件的尺寸的标准差表明了生产加工技术的稳定性。变异系数是标准差与均值的比值,常用于比较变量的变异程度,如A加工零件尺寸的变异系数为15%,而B为10%,表明A加工技术要比B稳定。切比雪夫定理认为与均值距离在Z个标准差以内的CASE例至少为1-1/Z,一般情况下68%的数据与均值距离在一个标准差以内,95%的数据在2个标准差以内,几乎所有的数据都在3个标准差以内,以上所述可以用于异常值的检测,然后确定异常值是否
19、正确。4 参数检验分为一个总体参数的检验和两个总体参数的比较检验,前者是为了确定某一总体的参数是不是某一个值,而后者是为了比较两个总体的参数是不是相等。检验(z检验和T检验)什么参数则需要根据样本计算什么参数的值及该参数的标准差(/或S/),如要检验均值是否为某个值则需要根据样本计算样本均值及样本均值的标准差。5大量的数字既繁琐又不直观;需要对数据做人们时间和耐心所允许的简化,我们可以用 “平均”,“差距”或百分比等来概括大量数字。由于定性变量主要是计数,比较简单,常用的概括就是比例或百分比。下面主要介绍关于定量变量的数字描述。6概率分布是关于总体的概念。有了概率分布就等于知道了总体。6统计中
20、各种常用分布CHI-SQUARE分布, 一个正态分布的变量的平方服从自由度为1的CHI-SQUARE分布,K个独立的正态分布变量的平方和则服从自由度为K的CHI-SQUARE分布,在统计中CHI-SQUARE的自由度的意义是独立观察值的个数K,自由度是卡方分布的参数就像均值和标准差是正态分布的参数一样,如样本中每个灯泡的寿命服从正态分布,则5个灯泡的寿命的平方和服从自由度为5的卡方分布。CHI-SQUARE可以用于总体标准差是否为某值的假设检验。T分布,X来自一个正态总体样本,则变量服从T分布,其中U是总体的均值,S是样本方差,N是样本中样本点的数量,自由度为N-1,T统计量是根据样本数据计算
21、而得。F分布,两个相互独立样本的样本方差之比在代入样本数据之前叫做F变量,代入样本数据之后叫做F统计量,服从F分布,F统计量经常用于比较两个样本的方差是否相等的假设检验,分子分母的样本方差的计算公式分别为、,记为F(M-1,N-1)。另外它也可以用于检验拟合优度的显著性此时,n是观察值的个数,k是包括截距在内的解释变量的个数。F-分布变量为两个-分布变量(在除以它们各自自由度之后)的比;而两个-分布的自由度则为F-分布的自由度,因此,F-分布有两个自由度;第一个自由度等于在分子上的-分布的自由度,第二个自由度等于在分母的-分布的自由度。二项分布,二项试验是指把相同的试验进行N次,并且每次试验只
22、有两种可能的结果,单次试验成功的概率为P,每一次试验都独立进行,如果对于卖保单的例子,如果随时间推移推销员疲劳并失去了热情,则不能保证“单次试验成功概率为P”。在一个二项试验中,我们关心的是在N次试验中出现成功的次数,如果以X表示N次试验中成功的次数,我们可以看到X可取的值为0、1、2N因为值的个数是有限的,故X是离散型随机变量,与该随机变量有关的概率分布叫做二项分布(属于离散型),如果知道每个顾客进店买某商品的概率和进店顾客的数量(根据以往的经验取得),则可以估计每天需要的货量。二项分布是指做有限次只有两个结果的试验中,实验成功次数为B的概率,泊松分布是指做无限次只有两个结果的试验中,实验成
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 计量 经济学 读书笔记
链接地址:https://www.31doc.com/p-2346197.html