第7章系统预测3回归分析ppt课件.ppt
《第7章系统预测3回归分析ppt课件.ppt》由会员分享,可在线阅读,更多相关《第7章系统预测3回归分析ppt课件.ppt(110页珍藏版)》请在三一文库上搜索。
1、7.4 回归分析预测法,2,回归,3,回归的由来,由英国著名统计学家Francis Galton在19世纪末期研究孩子及其父母的身高时提出来的。 Galton发现身材高的父母,他们的孩子身材也高。但这些孩子平均起来并不像他们的父母那样高。对于比较矮的父母情形也类似:他们的孩子比较矮,但这些孩子的平均身高要比他们的父母的平均身高高 Galton把这种孩子的身高向平均值靠近的趋势称为一种回归效应,而他发展的研究两个数值变量的方法称为回归分析,4,多元回归在卫生检验中的应用,5,什么是回归分析?(regression),1、从一组样本数据出发,确定变量之间的数学关系式。 2、对这些关系式的可信程度进
2、行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著。 3、利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度。,6,变量间的关系 函数关系 相关关系 相关关系的描述与度量 散点图 相关系数 相关系数的显著性检验,7.4.1 变量间关系的描述与度量,7,变量间的关系,8,函数关系,1、是一一对应的确定关系 2、设有两个变量x和y ,变量y 随变量x一起变化,并完全依赖于x,当变量x取某个数值时,y依确定的关系取相应的值,则称y是x的函数,记为y = f (x),其中x称为自变量,y称为因变量 3、各观测点落在
3、一条线上,9,函数关系的例子,某种商品的销售额y与销售量x之间的关系可表示为 y = px (p 为单价) 圆的面积S与半径R之间的关系可表示为S=R2 企业的原材料消耗额y与产量x1、单位产量消耗x2 、原材料价格x3之间的关系可表示为 y = x1x2x3,10,相关关系(correlation),1、变量间关系不能用函数关系精确表达 2、一个变量的取值不能由另一个变量唯一确定 3、当变量 x 取某个值时,变量 y 的取值可能有几个 4、各观测点分布在直线周围,11,相关关系的描述与度量,相关分析 变量之间是否存在关系? 如果存在关系,它们之间是什么样的关系? 变量之间的关系强度如何? 样
4、本所反映的变量之间的关系能否代表总体变量之间的关系?,12,散点图(scatter diagram),13,散点图(例题分析),【例】一家大型商业银行在多个地区设有分行,其业务主要是进行基础设施建设、国家重点项目建设、固定资产投资等项目的贷款。近年来,该银行的贷款额平稳增长,但不良贷款额也有较大比例的增长,这给银行业务的发展带来较大压力。为弄清不良贷款形成的原因,管理者希望利用银行业务的有关数据进行定量分析,以便找出控制不良贷款的办法。下面是该银行所属的25家分行2002年的有关业务数据,14,散点图(例题分析),15,散点图 (不良贷款对其他变量的散点图),16,散点图 (5个变量的散点图矩
5、阵),不良贷款,贷款余额,累计应收贷款,贷款项目个数,固定资产投资,17,相关系数,相关(correlation)系数:描述两个数值变量线性相关的方向和强度。,18,提问,相关系数与x、y的顺序相关,即x、y之间有主从关系没有?,19,正的r值显示变量之间有正相关,负的r值显示出负相关 相关系数r的值永远在-1和+1之间 |r|=1:完全线性相关 0r1:正线性相关 -1r0:负线性相关 r=0:不存在线性相关关系,或不相关(没有关系),相关系数的性质,20,r=0.4,r=0.8,r=-0.4,r=-0.8,相关系数的性质,r=0,21,相关系数的性质,r,22,相关系数只是两变量直线相关强
6、度的度量;不能描述两变量间的曲线相关,不管这种相关关系有多强。,r=0!,相关系数的性质,23,相关系数 (例题分析),累计应收贷款,贷款项目个数,累计应收贷款,贷款项目个数,24,|r|0.8时,可视为两个变量之间高度相关 0.5|r|0.8时,可视为中度相关 0.3|r|0.5时,视为低度相关 |r|0.3时,说明两个变量之间的相关程度极弱,可视为不相关 注意:上述解释必须建立在对相关系数的显著性进行检验的基础之上,相关系数的经验解释,25,相关系数的显著性检验:若r在显著性水平下超过依赖于自由度n-2的临界值r(n-2, ),则认为其在显著性水平下与0显著不同,检验通过,并称相关系数是显
7、著的。,相关系数的显著性检验,相关系数表,备注:n为样本量,26,7.4 回归分析预测法,不确定的相关关系,回归分析,确定的函数关系,回归分析是因果关系分析中的一种,是研究相关关系的一种数学手段。,27,7.4 回归分析预测法,回归分析主要内容: 从数据出发,确定因变量和自变量之间的关系; 对关系式中的参数进行估计,并进行统计检验; 筛选自变量,即从大量自变量中找出影响显著的,剔除不显著的; 用求得的回归模型进行预测; 对预测结果进行分析、评价。,28,回归模型 (regression model),1、回答“变量之间是什么样的关系?” 2、方程中运用 1 个数值型因变量(响应变量) 被预测的
8、变量 1 个或多个数值型变量 (解释变量) 用于预测的变量 3、主要用于预测和估计,29,1、定义 一元线性回归预测是处理因变量y与自变量x 之间线性关系的回归预测法,其数学模型为:,其中a、b称为回归系数,首先根据x、y的现有统计数据,在直角坐标系中作散点图,观察y随x而变是否为近似的线性关系。若是,则求出式(7.4.1)中的a、b值,就可确定其数学模型,然后由x的未来变化去求相应的y 值。,7.4.2 一元线性回归分析预测,30,2、a、b的确定方法,(1)解联立方程组,将式(7.4.1)两边分别求和 将式(7.4.1)两边分别乘 再求和,求解后得到,7.4.2 一元线性回归分析预测,31
9、,7.4.2 一元线性回归分析预测,32,(2)直接用最小二乘法,使拟合的数值与实际值的总方差为最小,即拟合程度最好,则得两者之差ei,根据极值原理,式(7.4.6)对a、b分别求偏导,并令其=0,得,7.4.2 一元线性回归分析预测,33,7.4.2 一元线性回归分析预测,34,7.4.2 一元线性回归分析预测,35,Sxx称之为xi的方差和(离差平方和) Sxy称之为xi与yi的协方差和(离差积之和),7.4.2 一元线性回归分析预测,36,3、回归效果检验,y=a+bx一定程度上反映了y与x之间的统计线性相关关系,该关系是否密切,决定了所采用线性预测模型多大程度上可信。这可以通过y与x的
10、相关系数rxy的大小来确定。,7.4.2 一元线性回归分析预测,37,3、回归效果检验,rxy的取值(P136图7-7): | rxy|=1,样本点完全落在回归线上,y与x有完全的线性关系; 0rxy1,y与x有一定的正线性相关关系,即y随着x的增加而成比例倍数增加; -1rxy0, y与x有一定的负线性相关关系,即y随着x的增加而成比例倍数减少; rxy=0,y与x之间不存在线性相关关系。,7.4.2 一元线性回归分析预测,查相关系数表(教材P.384附表二),若|rxy|表中相应数字r临界值,表示x、y间存在线性相关,预测模型可用。,38,r临界值是对不同的样本容量n,在两种置信度95%、
11、99%下的相关系数的临界值,即r临界值与样本容量n、以及所要求的置信度1-(给定的显著水平 )有关。,7.4.2 一元线性回归分析预测,39,4、简化算法,对具有类似等差时间序列关系的统计数据进行预测时, 可以采用此法。,由计算a、b的式(7.4.2)、(7.4.3),发现,若能使其中的xi=0,则计算a、b就会大大简化为,7.4.2 一元线性回归分析预测,40,如何使xi=0?,当xi为等差自然数列时,可引入“集中时间序列”即使等差序列呈对称形态。,在给xi编号时可以这样处理:,(1)若n为奇数,取xi的时间间隔为1,将x=0置于资料期 的中央; (2)若n为偶数,取xi的时间间隔为2,将x
12、= -1(+1)置 于资料期中央的上(下)期。,例7.4.1 某服装厂最近5年的服装产量如下表所示,请预 测该厂今明两年的产量。,年份 倒5年 倒4年 倒3年 前年 去年 今年 明年,产量(万元) 300 350 380 430 500 ? ?,7.4.2 一元线性回归分析预测,41,解:以年份为自变量xi,产量为因变量yi,在直角坐标系中画 散点图后发现y、x之间基本上呈线性关系,故可用一元线性 回归方法进行预测。 此处n=5为奇数,因此可列下表整理资料,并使xi=0,年份 倒5年 倒4年 大前年 前年 去年 平均值,xi -2 -1 0 1 2 0 0,yi 300 350 380 430
13、 500 1960 392,xiyi -600 -350 0 430 1000 480,Xi2 4 1 0 1 4 10,Yi2 90000 122500 144400 184900 250000 791800,7.4.2 一元线性回归分析预测,42,查相关系数表,此处n=5,若取=0.01,置信度(1- )=99% 查得,7.4.2 一元线性回归分析预测,43,由于rxyr临界值,所以x,y之间确实存在着线性相关,故 预测模型 可以用于预测。,7.4.2 一元线性回归分析预测,44,7.4.2 一元线性回归分析预测,45,不良贷款对贷款余额的散点图,7.4.2 一元线性回归分析预测,相关系数
14、:r=0.8436,显著性水平=0.01时,r(23,0.01)=0.505,46,7.4.2 一元线性回归分析预测,【例】求不良贷款对贷款余额的回归方程,回归方程为:y = -0.8295 + 0.037895 x 回归系数 =0.037895 表示,贷款余额每增加1亿元,不良贷款平均增加0.037895亿元,47,不良贷款对贷款余额的回归方程的图示,7.4.2 一元线性回归分析预测,48,1、基本概念 社会经济S中,影响事物发展的往往是多个因素,一元回归只是一种抽象,是抓主要矛盾的结果。有时分不清主次,只有通过多因素的多元回归才能反映事物的本质。 例如一个城市的公共交通营运总额y与该市的人
15、口总数x1、国民生产总值x2、商品流通量(或人口流动数)x3等多因素有关,经过分析抓住主要矛盾后,可建立如下二元线性回归预测模型:,7.4.3 多元线性回归分析预测法,49,一般而言,设系统变量y与k个自变量x1, x2, ,xk之间存在统计线性相关关系,且给定n组样本数据点如下: (y1, x11, x21,xk1), (y2, x12, x22,xk2), (yn, x1n, x2n,xkn) 则其满足: 于是多元线性回归预测模型可以表示为:,多元线性回归与矩阵方法相结合,是社会经济系统预测与规划的一个重要手段。,7.4.3 多元线性回归分析预测法,50,2、多元线性回归模型的参数估计 设
16、式(7.4.10)中 ,则其k+1个参数aj可利用最小二乘法进行估计,记,7.4.3 多元线性回归分析预测法,51,于是,式(7.4.10)可以表示为:,7.4.3 多元线性回归分析预测法,52,令误差平方和: 由极小值条件 可得(见推导):,记 系数矩阵(对称) 适于计算机实现,最小二乘法估计 是A的无偏估计。,7.4.3 多元线性回归分析预测法,53,手算时, 极小值条件可以表示为:,7.4.3 多元线性回归分析预测法,54,整理可得:,解上面的方程组即可得到a0, a1, , ak的估计值。,7.4.3 多元线性回归分析预测法,55,3、相关系数 记 RSS回归平方和 ESS剩余平方和
17、TSS总平方和,7.4.3 多元线性回归分析预测法,56,误差平方和的分解 (三个平方和的意义),1、回归平方和(RSSsum of squares of regression) 反映自变量 x 的变化对因变量 y 取值变化的影响,或者说,是由于 x 与 y 之间的线性关系引起的 y 的取值变化,也称为可解释的平方和 2、剩余(残差)平方和(ESSsum of squares of error) 反映除 x 以外的其他因素对 y 取值的影响,也称为不可解释的平方和或剩余平方和 3、总平方和(TSStotal sum of squares) 反映因变量的 n 个观察值与其均值的总误差,57,误差
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 系统 预测 回归 分析 ppt 课件
链接地址:https://www.31doc.com/p-2542084.html