2020版《微点教程》高考人教A版文科数学一轮复习文档:第九章 第四节 变量间的相关关系、统计案例 Word版含答案.pdf
《2020版《微点教程》高考人教A版文科数学一轮复习文档:第九章 第四节 变量间的相关关系、统计案例 Word版含答案.pdf》由会员分享,可在线阅读,更多相关《2020版《微点教程》高考人教A版文科数学一轮复习文档:第九章 第四节 变量间的相关关系、统计案例 Word版含答案.pdf(20页珍藏版)》请在三一文库上搜索。
1、第四节 变量间的相关关系、统计案例 2019 考纲考题考情 1两个变量的线性相关 (1)正相关 在散点图中,点散布在从左下角到右上角的区域,对于两个 变量的这种相关关系,我们将它称为正相关。 (2)负相关 在散点图中,点散布在从左上角到右下角的区域,对于两个 变量的这种相关关系,我们将它称为负相关。 (3)线性相关关系、回归直线 如果散点图中点的分布从整体上看大致在一条直线附近, 我 们就称这两个变量之间具有线性相关关系, 这条直线叫做回归直 线。 2回归方程 (1)最小二乘法 使得样本数据的点到回归直线的距离的平方和最小的方法 叫做最小二乘法。 (2)回归方程 方程x是两个具有线性相关关系的
2、变量的一组数据(x1, y1),(x2,y2),(xn,yn)的回归方程,其中 , 是待定参数。 Error!Error! 3回归分析 (1)定义 : 对具有相关关系的两个变量进行统计分析的一种常 用方法。 (2)样本点的中心 对于一组具有线性相关关系的数据(x1, y1), (x2, y2), (xn, yn)中( , )称为样本点的中心。 xy (3)相关系数 当 r0 时,表明两个变量正相关; 当 r3.841, 这表明小概率事件发生。 根据假设检验的基本原理,应该断定“是否选修文科与性别之间 有关系”成立,并且这种判断出错的可能性约为 5%。 答案 5% 二、走近高考 3(2017山东
3、高考)为了研究某班学生的脚长 x(单位:厘米) 和身高 y(单位:厘米)的关系,从该班随机抽取 10 名学生,根据 测量数据的散点图可以看出 y 与 x 之间有线性相关关系, 设其回 归直线方程为x。已知 i225,i1 600,4。 10 i1 x 10 i1 y 该班某学生的脚长为 24,据此估计其身高为( ) A160B163 C166D170 解析 易知22.5, 160。 因为4, 所以 160 225 10 1 600 10 422.5,解得70,所以回归直线方程为4x70,当 x24 时,9670166。故选 C。 答案 C 三、走出误区 微提醒:混淆相关关系与函数关系;不知道回
4、归直线必 过样本点中心;对独立性检验 K2值的意义不清楚。 4两个变量的相关关系有正相关,负相关,不相关, 则下列散点图从左到右分别反映的变量间的相关关系是( ) AB CD 解析 第一个散点图中, 散点图中的点是从左下角区域分布 到右上角区域,则是正相关;第三个散点图中,散点图中的点是 从左上角区域分布到右下角区域, 则是负相关 ; 第二个散点图中, 散点图中的点的分布没有什么规律,则是不相关,所以应该是 。 答案 D 5 某医疗机构通过抽样调查(样本容量 n1 000), 利用 22 列联表和 K2统计量研究患肺病是否与吸烟有关。计算得 K2 4.453, 经查阅临界值表知 P(K23.8
5、41)0.05, 现给出四个结论, 其中正确的是( ) A在 100 个吸烟的人中约有 95 个人患肺病 B若某人吸烟,那么他有 95%的可能性患肺病 C有 95%的把握认为“患肺病与吸烟有关” D只有 5%的把握认为“患肺病与吸烟有关” 解析 由已知数据可得,有 10.0595%的把握认为“患 肺病与吸烟有关” 。故选 C。 答案 C 6某车间为了规定工时定额,需要确定加工零件所花费的 时间,为此进行了 5 次试验。根据收集到的数据(如下表),由最 小二乘法求得回归方程为0.67x54.9。 零件数 x/个1020304050 加工时间 y/min62758189 现发现表中有一个数据模糊看
6、不清,则该数据为_。 解析 设表中那个模糊看不清的数据为 m。由表中数据得x 30, ,所以样本点的中心为,因为样 y m307 5 (30, m307 5 ) 本点的中心在回归直线上, 所以0.673054.9, 解得 m m307 5 68。 答案 68 考点一 变量相关关系的判断 【例 1】 (1)下列四个散点图中,变量 x 与 y 之间具有负的 线性相关关系的是( ) (2)为研究语文成绩和英语成绩之间是否具有线性相关关系, 统计某班学生的两科成绩得到如图所示的散点图(x 轴、y 轴的单 位长度相同),用回归直线方程x近似地刻画其相关关系,根 据图形,以下结论最有可能成立的是( ) A
7、线性相关关系较强,的值为 1.25 B线性相关关系较强,的值为 0.83 C线性相关关系较强,的值为0.87 D线性相关关系较弱,无研究价值 解析 (1)观察散点图可知,只有 D 选项的散点图表示的是 变量 x 与 y 之间具有负的线性相关关系。故选 D。 (2)由散点图可以看出两个变量所构成的点在一条直线附近, 所以线性相关关系较强,且应为正相关,所以回归直线方程的斜 率应为正数, 且从散点图观察, 回归直线方程的斜率应该比 yx 的斜率要小一些,综上可知应选 B。 答案 (1)D (2)B 相关关系的直观判断方法就是作出散点图, 若散点图呈带状 且区域较窄,说明两个变量有一定的线性相关性,
8、若呈曲线型也 是有相关性,若呈图形区域且分布较乱则不具有相关性。 【变式训练】 (1)在一组样本数据(x1, y1), (x2, y2), (xn, yn)(n2, x1, x2, xn不全相等)的散点图中, 若所有样本点(xi, yi)(i1,2,n)都在直线 y x1 上,则这组样本数据的样 1 2 本相关系数为( ) A1B0 CD1 1 2 (2)已知变量 x 和 y 满足关系 y0.1x1,变量 y 与 z 正相 关。下列结论中正确的是( ) Ax 与 y 正相关,x 与 z 负相关 Bx 与 y 正相关,x 与 z 正相关 Cx 与 y 负相关,x 与 z 负相关 Dx 与 y 负
9、相关,x 与 z 正相关 解析 (1)完全的线性关系, 且为负相关, 故其相关系数为 1。故选 A。 (2)由 y0.1x1,知 x 与 y 负相关,即 y 随 x 的增大而减 小,又 y 与 z 正相关,所以 z 随 y 的增大而增大,减小而减小, 所以 z 随 x 的增大而减小,x 与 z 负相关,故选 C。 答案 (1)A (2)C 考点二 线性回归分析 【例 2】 改革开放 40 年来,全国居民人均可支配收入由 171 元增加到 2.6 万元,中等收入群体持续扩大。我国贫困人口 累计减少 7.4 亿人,贫困发生率下降 94.4 个百分点,谱写了人类 反贫困史上的辉煌篇章。 某地级市共有
10、 200 000 名中学生,其中有 7%的学生在 2017 年享受了“国家精准扶贫”政策,在享受“国家精准扶贫”政策 的学生中困难程度分为三个等次 : 一般困难、很困难、特别困难, 且人数之比为 532,为进一步帮助这些学生,当地市政府设 立“专项教育基金” ,对这三个等次的困难学生每年每人分别补 助 1 000 元、1 500 元、2 000 元。经济学家调查发现,当地人均 可支配年收入较上一年每增加 n%,一般困难的学生中有 3n%会 脱贫,脱贫后将不再享受“精准扶贫”政策,很困难的学生中有 2n%转为一般困难学生,特别困难的学生中有 n%转为很困难学 生。 现统计了该地级市 2013 年
11、到 2017 年共 5 年的人均可支配年 收入, 对数据初步处理后得到了如图所示的散点图和表中统计量 的值,其中年份 x 取 13 时代表 2013 年,x 取 14 时代表 2014 年,依此类推,且 x 与 y(单位:万元)近似满足关系式x, (2013 年至 2019 年该市中学生人数大致保持不变) (yi)2 5 i1 (xi)(yi) 5 i1 0.83.11 (1)估计该市 2018 年人均可支配年收入为多少万元? (2)试问该市 2018 年的“专项教育基金”的财政预算大约为 多少万元? 附 : 对于一组具有线性相关关系的数据(u1, v1), (u2, v2), (un,vn)
12、,其回归直线方程u的斜率和截距的最小二乘估计分 别为,。 解 (1)因为 (1314151617)15, 1 5 所以(xi)2(2)2(1)2122210, 5 i1 所以0.1, 0.80.1150.7, 所以0.1x0.7。 当 x18 时,2018 年人均可支配年收入 y0.1180.7 1.1(万元)。 (2)由题意知 2017 年时该市享受“国家精准扶贫”政策的学 生共 200 0007%14 000 人。 一般困难、很困难、特别困难的中学生依次有 7 000 人、4 200 人、2 800 人,2018 年人均可支配年收入比 2017 年增长 0.110%。 0.1 180.70
13、.1 170.7 0.1 170.7 故 2018 年该市特别困难的中学生有 2 800(110%)2 520 人, 很困难的学生有 4 200(120%)2 80010%3 640 人, 一般困难的学生有 7 000(130%)4 20020%5 740 人。 所以 2018 年的 “专项教育基金” 的财政预算大约为 5 7400. 1 3 6400.152 5200.21 624(万元)。 1对变量值的预测主要是由给出的变量的值预测与其有相 关关系的变量的值,一般方法是:若已知回归直线方程,则直接 将数值代入求得预测值。 2回归模型的拟合效果主要有两种途径判断 (1)利用数据的散点图, 观
14、察数据对应的点与回归直线的位置 关系进行分析; (2)利用残差进行分析, 最简单的作法是选择数据中的具有代 表性的点进行预报,比较预报值与真实值的差距进行分析。 【变式训练】 (2018全国卷)如图是某地区 2000 年至 2016 年环境基础设施投资额 y(单位:亿元)的折线图。 为了预测该地区 2018 年的环境基础设施投资额,建立了 y 与时间变量 t 的两个线性回归模型。根据 2000 年至 2016 年的数 据(时间变量 t 的值依次为 1,2,17)建立模型:30.4 13.5t;根据 2010 年至 2016 年的数据(时间变量 t 的值依次为 1,2,7)建立模型:9917.5
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 微点教程 2020版微点教程高考人教A版文科数学一轮复习文档:第九章 第四节变量间的相关关系、统计案例 Word版含答案 2020 教程 高考 文科 数学 一轮 复习 文档 第九 第四 变量 相关
链接地址:https://www.31doc.com/p-4813449.html