第八章相关与回归.ppt
《第八章相关与回归.ppt》由会员分享,可在线阅读,更多相关《第八章相关与回归.ppt(51页珍藏版)》请在三一文库上搜索。
1、第八章 相关与回归,相关分析概述 相关关系的测定 一元线性回归分析,第一节 相关分析概述,一、函数关系与相关关系 正方形面积与边长;脚长与智商;销售收入和消费情况;广告投入与销售收入;GDP与精神病患者;头发长与见识短 1.函数关系: 变量之间存在严格的数量关系。 2. 相关关系: 变量之间存在不确定的依存关系。,二、分类 1.按相关关系涉及的变量多少划分:单相关、复相关、偏相关。 2.按相关形式划分:线性相关和曲线相关。 3.按相关的方向划分:正相关和负相关。 4.按相关关系的程度划分:完全相关,不完全相关和不相关。 5.按相关性质分为:真实相关和虚假相关。,二、相关关系的种类,相关分析:研
2、究变量之间相关方向和相关密切程度的统计分析方法。 (1)确定现象之间有无相关关系,以及相关关系的表现形态 (2)确定相关关系的密切程度 (3)建立合适的数学模型 (4)测定估计值的可靠程度,三、相关分析的内容,定性分析,依据研究者的理论知识和实践经验,对客观现象之间是否存在相关关系,以及何种关系作出判断。,定量分析,在定性分析的基础上,通过编制相关表、绘制相关图、计算相关系数等方法,来判断现象之间相关的方向、形态及密切程度。,第二节 相关关系的测定,一、相关图:又称散点图。将x置于横轴上,y置于纵轴上,将(x,y)绘于坐标图上。用来反映两变量之间相关关系的图形。,二、相关系数 (一)相关系数的
3、定义 1、相关系数:在线性条件下说明两个变量之间相关关系密切程度的统计分析指标。,2、相关系数r的取值范围:-1r1,0|r|1表示存在不同程度线性相关: |r| 0.3 为微弱相关; 0.3 |r| 0.5为低度线性相关; 0.5|r| 0.8为显著性线性相关。 0.8 |r| 为高度相关,r0 为正相关,r 0 为负相关; |r|=0 表示不存在线性关系; |r|1 表示完全线性相关;(函数关系),例:下表是有关15个地区某种食物需求量和地区人口增加量的资料。,(1)相关关系不等于因果关系; (2)相关系数只度量变量间的线性关系,因此,弱相关不一定表明变量间没有关系; (3)极端值可能影响
4、相关系数。 (4)警惕虚假相关,3、使用相关系数时应注意的问题,第三节 一元线性回归分析,回归分析,通过一个变量x或一些变量(x1,x2,x3)的变化解释另一变量y的变化。即根据相关关系的数量表达式(回归方程式)与给定的自变量x,揭示因变量y在数量上的平均变化和求得因变量的预测值的统计分析方法,回归方程,回归模型,反映自变量和因变量之间数学联系的表达式。,某一类回归方程的总称。,1、根据理论和对问题的分析判断, 区分自变量和因变量;,2、设法找出适合的数学方程式(即 回归模型)描述变量间的关系,3、对回归模型进行统计检验;,4、统计检验通过后,利用回归模型,根据解释变量去估计,预测 因变量。,
5、一、回归分析的内容,二、一元线性回归方程,样本一元线性回归方程:,斜率(回归系数),截距a 表示在没有自变量x的影响时,其它各种因素对因变量y的平均影响;回归系数b 表明自变量x每变动一个单位,因变量y平均变动b个单位。,三、直线回归方程的求解原理 最小二乘法,使因变量的观察值与估计值之间的离差平方和达到最小来求得 a 和 b 的方法。,用最小二乘法拟合的直线来代表x与y之间的关系与实际数据的误差比其他任何直线都小。,例:配合回归直线,思考题,不定向选择 1、圆的面积与半径之间存在着( ) A 相关关系 B 因果关系C 函数关系 D比较关系 2、下列现象属于相关关系的有( ) A 职工家庭收入
6、不断增加,消费支出也相应增加 B 工人文化技术水平越高,劳动效率也越高 C 在电阻一定的电路中,电压随电流强度大小而确定 D 农作物施肥量增加,产量也随之增加。 3、自变量的值按一定数量增加时,应变量相应地按等量增加数量,反之亦然,那么自变量和应变量之间存在着( ) A 正相关关系 B 负相关关系 C 直线相关关系 D 曲线相关关系 E零相关关系 4、如果两个变量之间相关系数是1,则两个变量是( ) A 负相关关系 B 正相关关系 C 完全相关关系 D 不完全相关关系 5、如果两变量将的相关系数为-1,说明两变量间( ) A 高度相关关系 B 完全相关关系 C 低度相关关系 D 完全不相关,四
7、、一元线性回归方程的检验,(一) 回归模型检验的种类 回归模型的检验包括理论意义检验、回归方程的检验和回归系数的检验。,(二)拟合程度的评价 1、拟合程度,是指样本观测值聚集在样本回归线周围的紧密程度。 2、判断回归模型拟合程度优劣最常用的数量尺度是决定系数。它是建立在对总离差平方和进行分解的基础之上的。,3、离差平方和的分解,因变量 y 的取值是不同的,y 取值的这种波动称为变差。变差来源于两个方面: 由于自变量 x 的取值不同造成的; 除 x 以外的其他因素(如x对y的非线性影响、测量误差等)的影响。,3、离差平方和的分解 (三个平方和的关系),2) 两端平方后求和有,1)从图上看有,SS
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第八 相关 回归
链接地址:https://www.31doc.com/p-2969245.html