回归分析的基本思想及其初步应用1.ppt
《回归分析的基本思想及其初步应用1.ppt》由会员分享,可在线阅读,更多相关《回归分析的基本思想及其初步应用1.ppt(33页珍藏版)》请在三一文库上搜索。
1、3.1回归分析的基本思想及其初步应用,高二数学 选修1-2,问题1:正方形的面积y与正方形的边长x之间 的函数关系是,y = x2,问题2:某水田水稻产量y与施肥量x之间是否 有一个确定性的关系?,例如:在 7 块并排、形状大小相同的试验田上 进行施肥量对水稻产量影响的试验,得 到如下所示的一组数据:,复习、变量之间的两种关系,10 20 30 40 50,500 450 400 350 300,施化肥量,水稻产量,2、现实生活中存在着大量的相关关系。 如:人的身高与年龄; 产品的成本与生产数量; 商品的销售额与广告费; 家庭的支出与收入。等等,探索:水稻产量y与施肥量x之间大致有何规律?,1
2、0 20 30 40 50,500 450 400 350 300,发现:图中各点,大致分布在某条直线附近。,探索2:在这些点附近可画直线不止一条,哪条直线最能代表x与y之间的关系呢?,散点图,施化肥量,水稻产量,1、所求直线方程叫做回归直线方程; 相应的直线叫做回归直线。,2、对两个变量进行的线性分析叫做线性回归分析。,2、回归直线方程:,最小二乘法:,称为样本点的中心。,自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系叫做相关关系。,1、定义:,1):相关关系是一种不确定性关系;,注,例2、在一段时间内,某中商品的价格x元和需求量Y件之间的一组数据为:,试建立Y与x的回归直
3、线方程。,解:,例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。,求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。,案例1:女大学生的身高与体重,解:1、选取身高为自变量x,体重为因变量y,作散点图:,2、由散点图知道身高和体重有比较好的线性相关关系,因此可以用线性回归方程刻画它们之间的关系。,分析:由于问题中要求根据身高预报体重,因此选取身高为自变量,体重为因变量,2.回归方程:,1. 散点图;,本例中, r=0.7980.75这表明体重与身高有很强的线性相关关系,从而也表明我们建立的回归模型是有意义的。,探究: 身高为17
4、2cm的女大学生的体重一定是60.316kg吗?如果不是,你能解析一下原因吗?,答:身高为172cm的女大学生的体重不一定是60.316kg,但一般可以认为她的体重接近于60.316kg。,即,用这个回归方程不能给出每个身高为172cm的女大学生的体重的预测值,只能给出她们平均体重的值。,例1 从某大学中随机选取8名女大学生,其身高和体重数据如表1-1所示。,求根据一名女大学生的身高预报她的体重的回归方程,并预报一名身高为 172cm的女大学生的体重。,案例1:女大学生的身高与体重,解:1、选取身高为自变量x,体重为因变量y,作散点图:,2、由散点图知道身高和体重有比较好的线性相关关系,因此可
5、以用线性回归方程刻画它们之间的关系。,3、从散点图还看到,样本点散布在某一条直线的附近,而不是在一条直线上,所以不能用一次函数y=bx+a描述它们关系。,我们可以用下面的线性回归模型来表示: y=bx+a+e, (3) 其中a和b为模型的未知参数,e称为随机误差。,统计中,我们把自变量x称为解释变量,因变量y称为预报变量,思考: 产生随机误差项e的原因是什么?,随机误差e的来源(可以推广到一般): 1、忽略了其它因素的影响:影响身高 y 的因素不只是体重 x,可能还包括遗传基因、饮食习惯、生长环境等因素; 2、用线性回归模型近似真实模型所引起的误差; 3、身高 y 的观测误差。 以上三项误差越
6、小,说明我们的回归模型的拟合效果越好。,函数模型与回归模型之间的差别,函数模型:,回归模型:,函数模型与回归模型之间的差别,函数模型:,回归模型:,线性回归模型y=bx+a+e增加了随机误差项e,因变量y的值由自变量x和 随机误差项e共同确定,即自变量x只能解释部分y的变化。,在统计中,我们也把自变量x称为解释变量,因变量y称为预报变量。,所以,对于身高为172cm的女大学生,由回归方程可以预报其体重为,思考: 如何刻画预报变量(体重)的变化?这个变化在多大程度上 与解释变量(身高)有关?在多大程度上与随机误差有关?,假设身高和随机误差的不同不会对体重产生任何影响,那么所有人的体重将相 同。在
7、体重不受任何变量影响的假设下,设8名女大学生的体重都是她们的平均值, 即8个人的体重都为54.5kg。,在散点图中,所有的点应该落在同一条 水平直线上,但是观测到的数据并非如 此。这就意味着预报变量(体重)的值 受解释变量(身高)或随机误差的影响。,对回归模型进行统计检验,例如,编号为6的女大学生的体重并没有落在水平直线上,她的体重为61kg。解释 变量(身高)和随机误差共同把这名学生的体重从54.5kg“推”到了61kg,相差6.5kg, 所以6.5kg是解释变量和随机误差的组合效应。,编号为3的女大学生的体重并也没有落在水平直线上,她的体重为50kg。解释 变量(身高)和随机误差共同把这名
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 回归 分析 基本 思想 及其 初步 应用
链接地址:https://www.31doc.com/p-2094128.html