第11讲简单线性回归.ppt
《第11讲简单线性回归.ppt》由会员分享,可在线阅读,更多相关《第11讲简单线性回归.ppt(52页珍藏版)》请在三一文库上搜索。
1、简单线性回归,Linear regression,回归是设法找出变量间在数量上的依存变化关系, 用函数表达式表达出来,这个表达式称之为回归方程。,两变量间的关系,确定性关系:两变量间的函数关系 圆的周长与半径的关系: C2R 速度、时间与路程的关系:LST X与Y的函数关系: Ya+bX 非确定性关系:两变量在宏观上存在关系,但并未精确到可以用函数关系来表达。 青少年身高与年龄的关系; 身高与体重的关系:标准体重(kg)=身高(cm)-105 药物浓度与反应率的关系;,一、线性回归的概念,当两个变量存在准确、严格的直线关系时,可以用Y=a+bX,表示两者的函数关系。 其中X 为自变量(inde
2、pendent variable);Y是因变量( dependent variable )。 但在实际生活当中,由于其它因素的干扰,许多双变量之间的关系并不是严格的函数关系,不能用函数方程来准确反映,为了区别于两变量间的函数方程,我们称这种关系为回归关系,用直线方程来表示这种关系称为回归直线或线性回归。,小插曲:为什么叫”回归“?,F. Galton K.Pearson,二、回归参数的估计,式中的 是由自变量X推算应变量Y的估计值,a是回归直线在Y 轴上的截距;b为样本的回归系数,即回归直线的斜率,表示当X变动一个单位时,Y平均变动b个单位。 计算原理:最小二乘法,即保证各实测点到回归直线的纵
3、向距离的平方和最小,并使计算出的回归方程最能代表实测数据所反映出的直线趋势。,例12-1 某医师为了研究正常成年男性的运动后最大心率与年龄的关系,测得20名正常成年男性的有关数据,散点图如下。,年龄与运动后最大心率的回归方程,回归系数和回归方程的意义及性质,b 的意义 a 的意义 的意义 的意义 的意义,b 的意义,斜率(slope) 301.3124 -3.218 X 年龄每增加 1 岁,其运动后最大心率平均减少 3.218(次/分钟) b 的单位为 (Y的单位/X的单位),b0,y increase with the increase of X b0,y decrease with the
4、 increase of X b=0,no linear correlation between two variables.,X,Y,b is the regression coefficient and the slope of the line 。,statistical significance of b :when X changed a unit , the Y changed b units on average.,b0,b0,b=0,a 的意义,a 截距(intercept, constant) X=0 时,Y的估计值 a的单位与Y值相同 当X可能取0时,a才有实际意义。,估计
5、值 的意义,X=46时, =153.2844, 即年龄为 46岁 的正常成年男性, 其平均运动后最大心率估计值为 153.2844 (次/分钟); 给定X时,Y的估计值。 当 时,,的意义,为残差:实测点到回归直线的纵向距离。,残差平方和 (residual sum of squares). 综合表示点距直线的纵向距离。 在所有的直线中,回归直线的残差平方和是最小的。(最小二乘),的意义,三、总体回归系数的假设检验,与直线相关一样,直线回归方程也是从样本资料计算而得的,同样也存在着抽样误差问题。所以,需要对样本的回归系数b进行假设检验,以判断b是否从回归系数为零的总体中抽得。总体的回归系数用表
6、示。,一般步骤,H0:=0 回归方程无意义 H1:0 回归方程有意义 =0.05 选择合适的假设检验方法(方差分析或t检验),计算统计量 计算概率值P 做出推论:统计学结论和专业结论,方差分析法,因变量总变异的分解,X,P (X,Y),Y,Y的总变异分解,未引进回归时的总变异: (sum of squares about the mean of Y) 引进回归以后的变异(剩余): (sum of squares about regression) 回归的贡献,回归平方和: (sum of squares due to regression),Y的总变异分解,剩余标准差,(1) 扣除了X的影响后
7、Y方面的变异; (2) 引进 回归方程后, Y方面的变异。,回归系数检验的基本思想,如果X与Y无线性回归关系,在SS回归和SS剩余都是其他随机因素对Y的影响,由此,MS回归MS剩余,总体回归系数=0,反之, 0。所以用F检验对X与Y之间有无回归关系进行检验。,公式,查F界值表,F0.05(1,18)=4.41,F F0.05(1,18) ,P0.05,拒绝H0,H0:=0 H1:0 =0.05,t检验法,Sb是样本回归系数的标准误,H 0: 0, H 1: 0, =0.05。,年龄与运动后最大心率间存在回归关系。,决定系数 (coefficient of determination),取值在0
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 11 简单 线性 回归
链接地址:https://www.31doc.com/p-2986075.html