线性回归分析的基本步骤要点.pdf
《线性回归分析的基本步骤要点.pdf》由会员分享,可在线阅读,更多相关《线性回归分析的基本步骤要点.pdf(13页珍藏版)》请在三一文库上搜索。
1、步骤一、建立模型 知识点: 1、总体回归模型、总体回归方程、样本回归模型、样本回归方程 总体回归模型: 研究总体之中自变量和因变量之间某种非确定依赖关系 的计量模型。 YXU 特点:由于随机误差项U 的存在,使得Y 和 X 不在一条直线 /平面上。 例 1:某镇共有60 个家庭,经普查,60 个家庭的每周收入(X)与每周 消费( Y)数据如下: 每周收入(X)每周消费支出( Y) 80 55 60 65 70 75 100 65 70 74 80 85 88 120 79 84 90 94 98 140 80 93 95 103 108 113 115 160 102 107 110 116
2、118 125 180 110 115 120 130 135 140 200 120 136 140 144 145 220 135 137 140 152 157 160 162 240 137 145 155 165 175 189 260 150 152 175 178 180 185 191 作出其散点图如下: 40 60 80 100 120 140 160 180 200 4080120160200240280 X Y 总体回归方程(线) :由于假定0EU,因此因变量的均值与自变量 总处于一条直线上, 这条直线|E YXX就称为总体回归线 (方程)。 总体回归方程的求法:以例1
3、的数据为例 1)对第一个 Xi,求出 E(Y|Xi)。 每周收入( X)每周消费支出( Y)E(Y|Xi) 80 55 60 65 70 75 65 100 65 70 74 80 85 88 77 120 79 84 90 94 98 89 140 80 93 95 103 108 113 115 101 160 102 107 110 116 118 125 113 180 110 115 120 130 135 140 125 200 120 136 140 144 145 137 220 135 137 140 152 157 160 162 149 240 137 145 155 1
4、65 175 189 161 260 150 152 175 178 180 185 191 173 由于 01 | iii E YXX, 因此任意带入两个Xi和其对应的E(Y|Xi)值, 即可求出 01 和,并进而得到总体回归方程。 如将 222777 100,|77200,|137XE YXXE YX和代 入 01 | iii E YXX可得: 010 011 7710017 1372000.6 以上求出 01 和反映了 E(Y|Xi)和 Xi之间的真实关系,即所求的总体回归 方程为:|170.6 iii E YXX,其图形为: 40 60 80 100 120 140 160 180 2
5、00 4080120160200240280 X Y Y vs. X 样本回归模型:总体通常难以得到,因此只能通过抽样得到样本数据。 如在例 1 中,通过抽样考察,我们得到了20 个家庭的样本数据: 每周收入( X)每周消费支出( Y) 80 55 100 65 70 120 79 84 140 80 93 160 102 107 110 180 110 200 120 136 220 135 137 240 137 145 260 150 152 175 那么描述样本数据中因变量Y 和自变量X 之间非确定依赖关系的模型 ? YXe就称为样本回归模型。 样本回归方程(线) :通过样本数据估计出
6、 ?,得到样本观测值的拟合 值与解释变量之间的关系方程 ? YX称为样本回归方程。如下图所示: 40 60 80 100 120 140 160 180 4080120160200240280 X Y Y vs. X 四者之间的关系: :总体回归模型建立在总体数据之上,它描述的是因变量Y 和自变量 X 之间的真实的非确定型依赖关系;样本回归模型建立在抽样数据基础之 上,它描述的是因变量Y 和自变量 X 之间的近似于真实的非确定型依赖 关系。这种近似表现在两个方面:一是结构参数 ? 是其真实值的一种 近似估计;二是残差e是随机误差项U 的一个近似估计; :总体回归方程是根据总体数据得到的,它描述
7、的是因变量的条件均值 E(Y|X)与自变量X 之间的线性关系;样本回归方程是根据抽样数据得到 的,它描述的是因变量Y 样本预测值的拟合值 ? Y与自变量 X 之间的线性 关系。 :回归分析的目的是试图通过样本数据得到真实结构参数的估计值, 并要求估计结果 ? 足够接近真实值。由于抽样数据有多种可能,每一 次抽样所得到的估计值 ? 都不会相同,即的估计量 ? 是一个随机变量。 因此必须选择合适的参数估计方法,使其具有良好的统计性质。 2、随机误差项U 存在的原因: 非重要解释变量的省略 人的随机行为 数学模型形式欠妥 归并误差(如一国GDP 的计算) 测量误差等 3、多元回归模型的基本假定 随机
8、误差项的期望值为零()0 i E U 随机误差项具有同方差性 2 ()1,2, i Var uin 随机误差项彼此之间不相关(,)0 ; ,1,2, ij Cov u uiji jn 解释就变量X1,X2, ,Xk为确定型变量,与随机误差项彼此不相关。 (,)0 1,2,1,2, ijj Cov Xuikjn 解释就变量X1,X2, ,Xk之间不存在精确的(完全的)线性关系,即解 释变量的样本观测值矩阵X 为满秩矩阵: rank(X)=k+1n 随机误差项服从正态分布,即:uiN(0, 2),i=1,2, ,n 步骤二、参数估计 知识点: 1、最小二乘估计的基本原理:残差平方和最小化。 2、参
9、数估计量: 一元回归: 12 01 ? ? ii i x y x YX 多元回归: 1 ? T X XX Y 3、最小二乘估计量的性质(Gauss-Markov 定理) : 在满足基本假设的情况下, 最小二乘估计量 ? 是的最优线性无偏估 计量( BLUE 估计量) 步骤三、模型检验 1、经济计量检验(后三章内容) 2、统计检验 拟合优度检验 知识点: :拟合优度检验的作用:检验回归方程对样本点的拟合程度 :拟合优度的检验方法:计算(调整的)样本可决系数 22 /RR 2 1 RSSESS R TSSTSS , 2/1 1 /1 ESSnk R TSSn 注意掌握离差平方和、回归平方和、 残差
10、平方和之间的关系以及它们 的自由度。 计算方法:通过方差分析表计算 方差来源符号计算公式自由度 (d.f.) 均方值 (MSS) 离差平方和TSS 2 i i YY n-1 2 i i YY/n-1 回归平方和RSS 2 ? i i YY k 2 ? i i YY/k 残差平方和ESS 2 ? i i YY n-k-1 2 ? i i YY/ n-k-1 例 2:下表列出了三变量(二元)模型的回归结果: 方差来源平方和( SS) 自由度均方值 离差平方和TSS66042 14 回归平方和 RSS65965 残差平方和 ESS 1)样本容量为多少? 解:由于 TSS的自由度为n-1,由上表知n-
11、114,因此样本容量n=15。 2)求 ESS 解:由于 TSSESSRSS,故 ESSTSSRSS77 3)ESS 和 RSS 的自由度各为多少? 解:对三变量模型而言,k=2,故 ESS 的自由度为 n-k-112 RSS 的自由度为 k2 4)求 22 RR和 解: 2 65965 0.9988 66042 RSS R TSS , 2 /1 10.9986 /1 ESS nk R TSS n 回归方程的显著性检验(F 检验) 目的:检验模型中的因变量与自变量之间是否存在显著的线性关系 步骤: 1、提出假设: 012 1 :.0 :0 ,1,2,., k j H Hjk至少有一 2、构造统
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 线性 回归 分析 基本 步骤 要点
链接地址:https://www.31doc.com/p-5211348.html