数学:1.1《回归分析的基本思想及其初步应用》课件(新人教A版选修1-2).ppt
《数学:1.1《回归分析的基本思想及其初步应用》课件(新人教A版选修1-2).ppt》由会员分享,可在线阅读,更多相关《数学:1.1《回归分析的基本思想及其初步应用》课件(新人教A版选修1-2).ppt(44页珍藏版)》请在三一文库上搜索。
1、回归分析的基本思想 及其初步应用,一、复习回顾:,1、求线性回归方程,2、线性相关关系强弱的判断:相关系数r,例1:从某大学中随机选取8名女大学生,其身高和体重数据如下表,求根据女大学生的身高预报体重的回归方程,并预报一名身高为172cm的女大学生的体重.,线性回归模型: y=0.849x-85.712+e,身高、随机误差对体重有没有影响?,二、新概念引入:,计算例1中总偏差平方和 SST=354,思考:预报变量(体重)与实际值有偏差即总偏差平方和,这个偏差变化在多大程度上与解释变量(身高)有关?在多大程度上与随机变量有关?,作用:表示随机误差的效应,残差平方和:样本值与回归值差的平方和,2.
2、残差:样本值与回归值差即,例1 SSE=128.361,思考:若体重仅受身高的影响,散点图又如何?,3.回归平方和:相应回归值与样本均值差的平方和,即:,SST=SSR+SSE,作用:表示解释变量的效应,例1 SSR=225.639,即刻画了预报变量的变化中由解释变量通过线性回归模型所引起的那部分变化程度,注:当总偏差平方和相对固定时,残差平方和越小,则回归平方和越大,此时模型的拟合效果越好 .,SST=SSR+SSE,4.有没有其他方法来刻划模型的拟合程度?,相关指数:,1)R2越大,说明残差平方和越小,回归平方和越大,则模型拟合效果越好。,2)R2表示解释变量对预报变量变化的贡献率,3)R
3、21,模型拟合效果越好,表示解释变量和预报变量的相关性越强。,例1 相关指数R2=0.64,说明了什么?,解释变量对总效应约贡献了64%,随机误差贡献了剩余的36%。,4)若采用了几种不同回归方程进行回归分析,通过比较R2值作出选择,即选择R2大的模型作为这组数据的模型。,问:有些时候,样本数据中难免混有错误数据,通过何种方法把它剔除?,5、残差分析:,判断原始数据中是否存在可疑数据,这方面的工作称为残差分析。,步骤:,1)计算每组数据的残差,2)画残差图。纵坐标为残差,横坐标为自变量。,3)分析残差图,4)找异常值,练:例1作出残差分析,即样本值减预测值,残差比较均匀地落在带状区域内,说明选
4、用的模型比较合适。,但第1个点与第6个点残差较大,需要分析。,回归模型合理,回归模型不是最好,回归模型不是最好,回归模型不是最好,例1用身高预测体重要注意的问题:,(1)回归方程所适用样本的总体,(2)回归方程所适用的时间性,(3)回归方程所适用的范围,(4)回归方程得到的是预报变量可能取值的平均值,相关性判定 公 式,残差分析公式,例1 小结,建立回归模型的步骤:,(1)明确研究对象,设好变量,(2)画出散点图,(3)选定回归方程类型,(4)求回归方程中的参数,(5)作残差图,进行残差分析,例2 关于x与y有如下数据:,为了对x、y两个变量进行统计分析,现有以下两种线性模型:y=6.5x+1
5、7.5,y=7x+17,试比较哪一个模型拟合的效果更好.,1)总偏差平方和=回归平方和+残差平方和,2)判断两个模型拟合程度:相关指数R2,3)如何进行残差分析?,4)求回归模型的步骤。,小结,例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。,求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。,案例1:女大学生的身高与体重,解:1、选取身高为自变量x,体重为因变量y,作散点图:,2、由散点图知道身高和体重有比较好的 线性相关关系,因此可以用线性回归方程 刻画它们之间的关系。,3、从散点图还看到,样本点散布在某一条 直线的附近,而
6、不是在一条直线上,所以 不能用一次函数y=bx+a描述它们关系。,我们可以用下面的线性回归模型来表示: y=bx+a+e,其中a和b为模型的未知参数, e称为随机误差。,思考P3 产生随机误差项e 的原因是什么?,思考P3 产生随机误差项e的原因是什么?,随机误差e的来源(可以推广到一般): 1、其它因素的影响:影响身高 y 的因素不只是体重 x,可能 还包括遗传基因、饮食习惯、生长环境等因素; 2、用线性回归模型近似真实模型所引起的误差; 3、身高 y 的观测误差。,函数模型与回归模型之间的差别,函数模型:,回归模型:,可以提供 选择模型的准则,函数模型与回归模型之间的差别,函数模型:,回归
7、模型:,线性回归模型y=bx+a+e增加了随机误差项e,因变量y的值由自变量x和 随机误差项e共同确定,即自变量x只能解析部分y的变化。,在统计中,我们也把自变量x称为解析变量,因变量y称为预报变量。,例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。,求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。,案例1:女大学生的身高与体重,解:1、选取身高为自变量x,体重为因变量y,作散点图:,2、由散点图知道身高和体重有比较好的 线性相关关系,因此可以用线性回归方程 刻画它们之间的关系。,3、从散点图还看到,样本点散布在某一条 直线的
8、附近,而不是在一条直线上,所以 不能用一次函数y=bx+a描述它们关系。,我们可以用下面的线性回归模型来表示: y=bx+a+e,其中a和b为模型的未知参数, e称为随机误差。,根据最小二乘法估计 和 就是未知参数a和b的最好估计,,根据最小二乘法估计 和 就是未知参数a和b的最好估计,,于是有b=,所以回归方程是,所以,对于身高为172cm的女大学生,由回归方程可以预报其体重为,探究P4: 身高为172cm的女大学生的体重一定是60.316kg吗?如果不是,你能解析一下原因吗?,探究P4: 身高为172cm的女大学生的体重一定是60.316kg吗? 如果不是,你能解析一下原因吗?,答:身高为
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归分析的基本思想及其初步应用 数学 1.1 回归 分析 基本 思想 及其 初步 应用 课件 新人 选修
链接地址:https://www.31doc.com/p-2436098.html