2020版高考数学新增分大一轮新高考(鲁京津琼)专用讲义:第十一章 11.3 变量间的相关关系、统计案例 Word版含解析.pdf
《2020版高考数学新增分大一轮新高考(鲁京津琼)专用讲义:第十一章 11.3 变量间的相关关系、统计案例 Word版含解析.pdf》由会员分享,可在线阅读,更多相关《2020版高考数学新增分大一轮新高考(鲁京津琼)专用讲义:第十一章 11.3 变量间的相关关系、统计案例 Word版含解析.pdf(31页珍藏版)》请在三一文库上搜索。
1、高清试卷 下载可打印 高清试卷 下载可打印 11.3 变量间的相关关系、统计案例 变量间的相关关系、统计案例 最新考纲 1.通过收集现实问题中两个有关联变量的数据作出散点图,并利用散点图直观认 识变量间的相关关系.2.经历用不同估算方法描述两个变量线性相关的过程知道最小二乘法 的思想,能根据给出的线性回归方程系数公式建立线性回归方程.3.通过对典型案例的探究, 了解独立性检验的基本思想、方法及其初步应用.4.通过对典型案例的探究,进一步了解回归 分析的基本思想、方法及简单应用 1两个变量的线性相关 (1)正相关 在散点图中,点散布在从左下角到右上角的区域,对于两个变量的这种相关关系,我们将它
2、称为正相关 (2)负相关 在散点图中,点散布在从左上角到右下角的区域,两个变量的这种相关关系称为负相关 (3)线性相关关系、回归直线 如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关 关系,这条直线叫做回归直线 2回归方程 (1)最小二乘法 求回归直线,使得样本数据的点到它的距离的平方和最小的方法叫做最小二乘法 (2)回归方程 方程 x 是两个具有线性相关关系的变量的一组数据(x1,y1),(x2,y2),(xn,yn)的y b a 高清试卷 下载可打印 高清试卷 下载可打印 回归方程,其中 , 是待定参数a b Error! 3回归分析 (1)定义:对具有相关
3、关系的两个变量进行统计分析的一种常用方法 (2)样本点的中心 对于一组具有线性相关关系的数据(x1,y1),(x2,y2),(xn,yn),其中( , )称为样本点的xy 中心 (3)相关系数 当 r0 时,表明两个变量正相关; 当 r0 时,正相关;当 r0 时,正相关;当 R ; 2 22 12 2 x,y 之间不能建立线性回归方程 答案 解析 在散点图中,点散布在从左上角到右下角的区域,因此 x,y 是负相关关系,故正确 ; 由散点图知用 y拟合比用 x 拟合效果要好,则 R R ,故正确 ; x,y 之间可 2 1e c x cy b a 2 12 2 以建立线性回归方程,但拟合效果不
4、好,故错误 题型二 回归分析 命题点 1 线性回归分析 例 2 下图是我国 2011 年至 2017 年生活垃圾无害化处理量(单位:亿吨)的折线图 注:年份代码 17 分别对应年份 20112017. 高清试卷 下载可打印 高清试卷 下载可打印 (1)由折线图看出,可用线性回归模型拟合 y 与 t 的关系,请用相关系数加以说明; (2)建立 y 关于 t 的回归方程(系数精确到 0.01),预测 2019 年我国生活垃圾无害化处理量 附注: 参考数据: i9.32,iyi40.17, 0.55,2.646. 7 i1 y 7 i1 t 7 i1 y i y 2 7 参考公式:相关系数 r, n
5、 i1 t ityi y n i1 t i t 2 n i1 y i y 2 回归方程 t 中斜率和截距的最小二乘估计公式分别为: , .y a b b n i1 t ityi y n i1 t i t 2 a yb t 解 (1)由折线图中数据和附注中参考数据得 4,(ti )228, 0.55.t 7 i1 t 7 i1 y i y 2 (ti )(yi ) iyii 7 i1 ty 7 i1 tt 7 i1 y 40.1749.322.89, 所以 r0.99. 2.89 0.55 2 2.646 因为 y 与 t 的相关系数近似为 0.99, 说明 y 与 t 的线性相关程度相当高,
6、从而可以用线性回归 模型拟合 y 与 t 的关系 (2)由 1.331 及(1)得y 9.32 7 高清试卷 下载可打印 高清试卷 下载可打印 0.10,b 7 i1 t ityi y 7 i1 t i t 2 2.89 28 1.3310.1040.93.a yb t 所以 y 关于 t 的回归方程为 0.930.10t.y 将 2019 年对应的 t9 代入回归方程得 0.930.1091.83.y 所以预测 2019 年我国生活垃圾无害化处理量约为 1.83 亿吨 命题点 2 非线性回归 例 3 某公司为确定下一年度投入某种产品的宣传费,需了解年宣传费 x(单位:千元)对年销 售量y(单
7、位:t)和年利润z(单位:千元)的影响,对近8年的年宣传费xi和年销售量yi(i1,2,8) 数据作了初步处理,得到下面的散点图及一些统计量的值 xyw (xi )2 8 i1 x(wi )2 8 i1 w(xi ) 8 i1 x (yi ) y (wi ) 8 i1 w (yi ) y 46.65636.8289.81.61 469108.8 表中 wi, i. xiw 1 8 8 i1 w 高清试卷 下载可打印 高清试卷 下载可打印 (1)根据散点图判断,yabx 与 ycd哪一个适宜作为年销售量 y 关于年宣传费 x 的回x 归方程类型?(给出判断即可,不必说明理由) (2)根据(1)的
8、判断结果及表中数据,建立 y 关于 x 的回归方程; (3)已知这种产品的年利润 z 与 x,y 的关系为 z0.2yx.根据(2)的结果回答下列问题: 年宣传费 x49 时,年销售量及年利润的预报值是多少? 年宣传费 x 为何值时,年利润的预报值最大? 附:对于一组数据(u1,v1),(u2,v2),(un,vn),其回归直线 u 的斜率和截距的最v 小二乘估计分别为 , . n i1 u iuvi v n i1 u i u 2 v u 解 (1)由散点图可以判断,ycd适宜作为年销售量 y 关于年宣传费 x 的回归方程类型x (2)令 w,先建立 y 关于 w 的线性回归方程,由于x 68
9、,d 8 i1 w iwyi y 8 i1 w i w 2 108.8 1.6 563686.8100.6,c yd w 所以 y 关于 w 的线性回归方程为 100.668w,y 因此 y 关于 x 的回归方程为 100.668.y x (3)由(2)知,当 x49 时, 年销售量 y 的预报值 100.668576.6,y 49 高清试卷 下载可打印 高清试卷 下载可打印 年利润 z 的预报值 576.60.24966.32.z 根据(2)的结果知,年利润 z 的预报值 0.2(100.668)xx13.620.12.z xx 所以当6.8,即 x46.24 时, 取得最大值x 13.6
10、2 z 故年宣传费为 46.24 千元时,年利润的预报值最大 思维升华 回归分析问题的类型及解题方法 (1)求回归方程 根据散点图判断两变量是否线性相关,如不是,应通过换元构造线性相关 利用公式,求出回归系数 . b 待定系数法:利用回归直线过样本点的中心求系数 . a (2)利用回归方程进行预测,把线性回归方程看作一次函数,求函数值 (3)利用回归直线判断正、负相关;决定正相关还是负相关的是系数 . b (4)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于 1 时,两变量的线性相关性 越强 跟踪训练 2 (2018全国)下图是某地区 2000 年至 2016 年环境基础设施投资额
11、 y(单位:亿元) 的折线图 高清试卷 下载可打印 高清试卷 下载可打印 为了预测该地区 2018 年的环境基础设施投资额,建立了 y 与时间变量 t 的两个线性回归模 型 根据2000年至2016年的数据(时间变量t的值依次为1,2, 17)建立模型 : 30. 4y 13.5t; 根据2010年至2016年的数据(时间变量t的值依次为1,2,7)建立模型 : 99y 17.5t. (1)分别利用这两个模型,求该地区 2018 年的环境基础设施投资额的预测值; (2)你认为用哪个模型得到的预测值更可靠?并说明理由 解 (1)利用模型,可得该地区 2018 年的环境基础设施投资额的预测值为 3
12、0.4y 13.519226.1(亿元) 利用模型,可得该地区 2018 年的环境基础设施投资额的预测值为 9917.59y 256.5(亿元) (2)利用模型得到的预测值更可靠 理由如下: ()从折线图可以看出, 2000 年至2016 年的数据对应的点没有随机散布在直线y30.413.5t 上下,这说明利用 2000 年至 2016 年的数据建立的线性模型不能很好地描述环境基础设施 投资额的变化趋势.2010 年相对 2009 年的环境基础设施投资额有明显增加,2010 年至 2016 年的数据对应的点位于一条直线的附近, 这说明从 2010 年开始环境基础设施投资额的变化规 律呈线性增长
13、趋势,利用 2010 年至 2016 年的数据建立的线性模型 9917.5t 可以较好地y 描述 2010 年以后的环境基础设施投资额的变化趋势,因此利用模型得到的预测值更可靠 ()从计算结果看,相对于 2016 年的环境基础设施投资额 220 亿元,由模型得到的预测值 226.1 亿元的增幅明显偏低, 而利用模型得到的预测值的增幅比较合理, 说明利用模型得 到的预测值更可靠 题型三 独立性检验 例 4 (2017全国)海水养殖场进行某水产品的新、旧网箱养殖方法的产量对比,收获时各随 机抽取了 100 个网箱,测量各箱水产品的产量(单位:kg),其频率分布直方图如下: 高清试卷 下载可打印 高
14、清试卷 下载可打印 (1)记 A 表示事件“旧养殖法的箱产量低于 50 kg” ,估计 A 的概率; (2)填写下面列联表,并根据列联表判断是否有 99%的把握认为箱产量与养殖方法有关: 箱产量6.635,故有 99%的把握认为箱产量与养殖方法有关 (3)箱产量的频率分布直方图表明 : 新养殖法的箱产量平均值(或中位数)在50 kg到55 kg之间, 旧养殖法的箱产量平均值(或中位数)在 45 kg 到 50 kg 之间,且新养殖法的箱产量分布集中程 度较旧养殖法的箱产量分布集中程度高,因此,可以认为新养殖法的箱产量较高且稳定,从 而新养殖法优于旧养殖法 思维升华 (1)比较几个分类变量有关联
15、的可能性大小的方法 通过计算 K2的大小判断:K2越大,两变量有关联的可能性越大 通过计算|adbc|的大小判断:|adbc|越大,两变量有关联的可能性越大 (2)独立性检验的一般步骤 根据样本数据制成 22 列联表 根据公式 K2计算 K2的观测值 k. nadbc2 abacbdcd 比较 k 与临界值的大小关系,做统计推断 跟踪训练 3 微信是现代生活进行信息交流的重要工具,某公司 200 名员工中 90%的人使用 微信, 其中每天使用微信时间在一小时以内的有 60 人, 其余的员工每天使用微信的时间在一 小时以上,若将员工分成青年(年龄小于 40 岁)和中年(年龄不小于 40 岁)两个
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2020版高考数学新增分大一轮新高考鲁京津琼专用讲义:第十一章 11.3 变量间的相关关系、统计案例 Word版含解析 2020 高考 数学 新增 一轮 鲁京津琼 专用 讲义 第十一 变量 相关 关系
链接地址:https://www.31doc.com/p-3056305.html