回归分析预测法.ppt
《回归分析预测法.ppt》由会员分享,可在线阅读,更多相关《回归分析预测法.ppt(35页珍藏版)》请在三一文库上搜索。
1、回归分析预测法,从本章起将讨论定量预测技术 第三章的基本思路来源于数学分析中数理统计的回归分析方法,将因素之间的规律(利用已知统计资料)设为按一定数学模型变化的运动轨迹,并假定: 未来的变化仍然是在已知的条件下进行,运动轨迹将不会发生畸变。,第一节 回归分析的基本概念,一.基本概念 1.回归分析的来由: 20世纪初,英统计学家 F.Golden 研究父子身高的遗传统计,高个子父母下一代比父亲更高的概率小于比他矮的概率,而矮个子父亲下一代比父亲高的概率大于比他矮的概率;且这两种高度父辈的后代,高度有向两种父辈平均身高靠拢的趋势,这种现象称为“回归”是一种自然界现象规律的提取。,2.回归分析 研究
2、变量之间的互相关系,把其中一些因素作为控制的变量,而把另一些随机变量作为因变量,利用适当的数学模型尽可能趋向于趋势变化的均值描述它们的关系的分析,称为回归分析。 即假定 y 与 x 相关,应有 y = f ( x ) 若 x1,x2, xn个变量影响y,应有 y = f (x1,x2, xn) 显然,有一些问题必须解决,因素分析 现代社会中,任何一件事物与多个因素相关,如何选取主要因素,忽略次要因素,使建立的数学模型不因变量太多而复杂,又能较好的抓住主要矛盾。 解决方法是求相关系数R 运动轨迹的模型 主要利用已知统计数据在图上打点进行观察分析,寻求一条最佳线路。采用最小二乘法,即在满足该条线路
3、的模拟值与真值总平方误差ei2为最小的条件下,来求出模拟数学模型各参数。(为Gauss-Markov最佳线性与无偏估计量 ),相关性检验 目的是鉴别所求出的模型是否可靠, 方法:利用相关性检验准则进行检验 精确度:即讨论在一定置信度条件下的置信区间 预测 :前面的问题已解决,数学模型已经建立且可靠, 精度问题也已解决,利用延续性原则代入需预测的数据,并求出结果。,二.方法分类 线性 线性 一元 多元 非线性 非线性,第二节 一元线性回归预测,一.回归方程的建立 假定需预测的目标为 y,与之对应的因素 x,随机抽样,子样数为 n ,通过图上打点作粗略估计已知的一组对应数据,初步定为线性关系,同时
4、再考虑到随机因素,应有: yi = a + b xi + ei i = 1,2,n (1) 不考虑随机因素,应有: yi = a + b xi i = 1,2,n (2) 代(2)入(1),求得随机项 ei = yi yi = yi ( a + bxi ) (3) ei 称为残差,这表示,真值与模拟直线y = a + bx之间存在实际误差 ei,累积平方误差为 Q = ei 2,称残差平方和,又称剩余平方和。 反之,我们已知的是实际数据(xi,yi),从可能的无穷条模拟直线中选取某一条直线,使之模拟得最好,标准为Q = e2i最小。 由(3) Q(a,b)= ei2 = (yi a-bxi)2
5、 求极值点,应有:Q(a,b)a = 0 及 Q(a,b)b = 0,得出 (yiabxi)= 0 (yiabxi)xi = 0 求出a,b a =(1/n) yi - b = (xiyinxy)/(xi2nx2) 记 (xix)2= lxxx的离差平方和 (xix)(yi-y) = lxyx,y离差乘积和,则b可简记为 b = lxy/lxx , a = y (lxy/lxx) x a,b称回归系数 y = a + bx 称线性回归方程。 这种方法称为最小二乘法,又叫最小平方法OLS(Ordinary Least Square),二. 一元线性回归方程的代表特性 1、 ei = 0 , 即残
6、差和为0 2 、 回归直线过点(x,y) y = a + bx 即过数据重心。 3 、 回归平均值等于离散平均值,即 = y,i=1,. n,三. 相关检验 相关检验解决两大问题: x与y是否线性相关及相关强弱如何? 它们之间相关显著性如何? 1、y的离差平方和 lyy = (yiy) 2 对于任意给定的xi,都有yi的波动,波动的大小可用yiy来评价,n次结果的总波动大小为lyy,数据分散程度。,2、回归平方和 U = ( y) 2 对于任意给定的xi,yi与xi是人为给定的线性变化而得到,它与实际的均值 必产生偏差,这种偏差是由回归而产生的,是回归偏差平方和U回归分散程度制定。 3.残差平
7、方和 Q = (yiy) 2 实际值与模拟值产生的误差,由于yi 随xi变化的随机特性引起,模拟的好则残差平方和应尽可能小 lyy = Q+U,这个公式中:离差平方和lyy是不可变更的客观存在,且残差平方和Q尽可能小,故有U lyy效果好,即yi与xi之间存在强的线性关系。 于是有定义:R2 =U/lyy (0R 1) 即 U = R2 lyy 由lyy = U+Q推出Q = (1R2) lyy 其中R称为相关系数。 当R=0为不相关,R +1为强正相关, R-1为强负相关,这样,通过研究相关系数R,可作出两个因素之间是否具有线性相关关系,且能判其相关程度。 相关程度的显著与不显著(即使相关性
8、强,但某因素对另一因素的影响不大,即不显著,那么这种因素也是不重要的)有一个具体界限,这是R检验。 由于抽样误差的影响,R达到的显著值与样本个数n有关,且取决于不同的显著性水平(或置信度),配成相关系数检验表,它们给出了在不同的n,a时,相关系数达到的最小值。,四、精度:即是在确定的置信度条件下,求出相应的置信区间:(n0) 当 a = 4.6% 时(yi 2s,yi+2s) a = 0.27% 时(yi 3s,yi+3s) 其中 S = Q/(n2),称为剩余标准差。 2004/10/11,五. 预测 利用公式 = a + bx 对于任意确定的时间(此时取y = a + bt)或数值(自变量
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析 预测
链接地址:https://www.31doc.com/p-4333923.html