第五章回归分析.ppt
《第五章回归分析.ppt》由会员分享,可在线阅读,更多相关《第五章回归分析.ppt(57页珍藏版)》请在三一文库上搜索。
1、第五章 回归分析,5.1 概述 回归分析研究变量与变量之间关系的数学方法。 变量之间的关系: (1)确定性关系:函数关系,经反复的精确试验或严格的数学推导得到。如 S= vt 。数学分析和物理学中的大多数公式属于这种类型。 (2)相关关系:实际问题中,绝大多数情况下,变量之间的关系不那么简单。如材料的抗拉强度与其硬度之间的关系;材料的性能与其化学成份之间等等。 这些变量之间既存在着密切的关系,又不能由一个(或几个)变量(自变量)的数值精确地求出另一个变量(因变量)的数值,,到多元回归例题,5.1 概述,而是要通过试验和调查研究,才能确定它们之间的关系,我们称这类变量之间的关系为相关关系。,回归
2、分析的主要内容: 应用数学的方法,对大量的测量数据进行处理,从而得出比较符合事物内部规律的数学表达式(数学模型)。 5 .2 最小二乘法原理 假设 x 和 y 是具有某种相关关系的物理量,它们之间的关系可用下式给出:,(51),待定常数,5 .2 最小二乘法原理,同时测量 x ,y 的数值,设有 m 对观测结果:,利用观测值,确定 。设 x,y 关系的最佳形式为:,(52),(53),最佳估计值,如不存在测量误差,则:,(54),由于存在测量误差,因而式(53)与(54)不相重合,即有:,(55),残差误差的实测值,5 .2 最小二乘法原理,式(53)中的 x 变化时,y 也随之变化。如果 m
3、 对观测值中有比较多的 y 值落到曲线(51)上,则所得曲线就能较为满意地反映被测物理量之间的关系,y 值同时出现的概率最大,则曲线(53)就是曲线(51)的最佳形式。如图51所示。如果误差服从正态分布,则概率 P(e1, e2, , em)为:,(57),当P最大时,求得的曲线就应当是最佳形式。从图51中可以看出,显然,此时下式应最小:,(56),即残差平方和最小,这就是最小二乘法原理的由来。,图51,5 .2 最小二乘法原理,这里假定 xi 无误差。式(57)可以写成:,(58),S最小,就应有:,(59),即要求求解如 下联立方程组:,(510),正规方程,最小二乘解。,5.3 直线的回
4、归,一、一元直线回归分析 对一元线性回归而言,就是配直线的问题,如研究腐蚀时间与腐蚀深度两个量之间的关系,可把腐蚀时间作为自变量 x ,把腐蚀深度作为因变量 y ,每对数据(x ,y)在直角坐标系中为一点,可得图52,称这种图为散点图。表51是试验得到的数据。,与 x 的关系大致呈直线关系,但并不是确定性的关系,而是一种相关关系:,回归系数,(511),最佳估计值应使其残差平方和最小,残差为:,(512),图52、表51,一、一元直线回归分析,其平方和为:,(513),平方和最小,即:,(514),得正规方程组:,(515),一、一元直线回归分析,令平均值为:,(516),由511得:,(51
5、7) (518),由式(515)得:,一、一元直线回归分析,(519),对表51 试验数据的回归直线方程的计算: 1、P149P150自学。 2、利用微软公司的 Excel 电子表格软件进行计算: 方法1:步骤如下: (1)先把数据在Excel中成列输入到电子表格中; (2)全部选择所有数据; (3)点击图表向导快捷按钮,按提示一步一步建立散点图;,直线回归方法,(3)建立好散点图后,用鼠标点到图上散点的位置,单击鼠标左键选中所有的散点,然后单击鼠标右键,出现一个对话框,点击左键选择添加趋势线,出现另一个对话框,在对话框中选择某些功能,回归直线方程就会出现在图上的某一位置。,方法2: (1)先
6、把数据在Excel中成列输入到电子表格中; (2)点击下拉菜单的“工具”按钮,鼠标箭头移动到“数据分析”项下,点击左键,出现数据分析对话框,在对话框中选择“回归”,点击“确定”按钮,出现回归对话框,按对话框中的提示,选择对话框中的某些功能,即可得出与直线回归有关的很多参数。 (3)利用计算出的参数,即可写出回归方程。,方差分析引用返回,二、方差分析,由 x 预报 ,精确度如何?用方差分析 解决这一问题。 残差可表示如下:,试验得到的数据,回归直线对应的数据,上式可改写成:,(524),移项得:,二、方差分析,两端平方求和得:,(525),可以证明此项为零,故得:,二、方差分析,上式中三项平方和
7、的意义如下:,代表在试验范围内,观测值 yi 总的波动情况,称此为总平方和。,代表 x 变化所引起的 y 值变化大小的量,即yi 波动中,可以通过回归方程计算出来的那一部分,称之为回归平方和。,上述三个平方和之间的关系,可以用图53表示出来。总平方和可以分解成两部分,回归平方和与残差平方和。,是残差平方和,表示了回归方程的拟合误差,即观测值yi 偏离回归值 的大小。这一部分不能通过回归方程计算出来,它是yi 波动中与 x 无关的部分。,图53,由图中可以看出,如果残差平方和很小,则回归平方和总平方和将接近于1。这时,所有的观测点都靠近或落在回归线上,这就表明回归直线的精度较高。,二、方差分析,
8、回归平方和、残差平方和、总平方和的计算见一元直线回归方法2。,残差平方和是排除了 x 对 y 的线性影响后的剩余部分,y 值随机波动程度的大小,用它来估计误差。 产生原因:包括随机误差、那些影响很小但尚未考虑的因素。 自由度: f总= f回 + f残 f总= m + 1 f回 =1 f残= f总 f回 = m - 2,二、方差分析,方差:残差平方和除以它的自由度:,标准偏差估算值:,(529),用S衡量随机因素对 y 的影响。 回归方程可作如下预报:,二、方差分析,回归方程可改写为:,(530),三、相关性检验 用一个数量性的指标,来衡量两个变量之间线性相关关系的密切程度相关系数 r 。,回归
9、平方和,总平方和,(531),r,1 时,说明标准误差很小(试验点与回归点几乎吻合),回归方程才有意义。通常 0r1。,二、方差分析,r 取值不同时的散点分布情况示于图54中,具体分析如下: (1) r = 0 时。此时 b = 0 ,即按最小二乘法确定的回归直线平行于 x 轴,这说明 y 的变化与 x 无关。故 x 与 y 之间没有线性关系。通常,散点的分布是完全不规则的,如图54(a)所示。 (2) 0r1。这时, x 与 y 之间存在着一定的线性关系。当 r 0 时 b0 ,散点分布有随 x 增加 y 增加的趋势,此时称 x 与 y 是正相关,如图54(b)所示。当 r 0 时 b0 ,
10、散点图呈 y 随 x 增加而减小的趋势,此时称 x 与 y 为负相关,如图54(c)所示。当 r 的绝对值比较大时,散点远离回归直线较为分散;当 r 的绝对值较大时,散点分布就靠近直线。 (3) r= 1。所有的点都在一条直线上,即散点都落在回归直线上。此时,称 x 与 y 完全性相关。实际上,此时 x 与 y 之间有确定性的线性关系。如图54(d)所示。,图54(a),图54(b),图54(c),图54(d),图54(e),二、方差分析,从上述讨论可以看出,相关系数 r 表示两个随机变量 x 与 y 之间线性相关的密切程度。 r越大,愈接近于1,x 与 y 之间的线性相关也就愈密切。但必须指
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第五 章回 分析
链接地址:https://www.31doc.com/p-3117615.html