《人教版高中数学选修2-3练习:第三章3.1第2课时残差分析Word版含解析.pdf》由会员分享,可在线阅读,更多相关《人教版高中数学选修2-3练习:第三章3.1第2课时残差分析Word版含解析.pdf(8页珍藏版)》请在三一文库上搜索。
1、第三章统计案例 3.1 回归分析的基本思想及其初步应用 第 2 课时残差分析 A 级基础巩固 一、选择题 1通过残差图我们发现在采集样本点过程中,样本点数据不准确 的是( ) A第四个B第五个 C第六个D第八个 解析: 由题图可知,第六个的数据偏差最大,所以第六个数据不 准确 答案: C 2为了表示 n 个点与相应直线在整体上的接近程度,我们常用的 表示法为 ( ) 解析:由回归直线方程可知,为一个量的估计值,而yi 为它的实际值,在最小二乘估计中(yiabxi)2,即( yi) 2. 答案: C 3.甲、乙、丙、丁 4 位同学各自对 A,B 两变量进行回归分析,分 别得到散点图与残差平方和如
2、下表所示: 分类甲乙丙丁 散点图 残差平方和115106124103 哪位同学的试验结果体现拟合A,B 两变量关系的模型拟合精度 高() A.甲B.乙 C.丙D.丁 解析:根据线性相关的知识,散点图中各样本点条状分布越均匀, 同时保持残差平方和越小(对于已经获取的样本数据,R2的表达式中 为确定的数,则残差平方和越小,R 2 越大),由回归分 析建立的线性回归模型的拟合效果越好,由试验结果知丁要好些 答案: D 4甲、乙、丙、丁四位同学各自对A,B 两变量的线性相关性做 实验,并用回归分析方法分别求得相关系数r 与残差平方和 m 如下表 所示: 分类甲乙丙丁 r 0.820.780.690.8
3、5 m 106115124103 则哪位同学的试验结果体现A、B 两变量有更强的线性相关性 ( ) A甲B乙 C丙D丁 解析:r 越接近 1,相关性越强,残差平方和 m 越小,相关性越强, 所以选 D 正确 答案: D 5如图所示, 5 个(x,y)数据,去掉D(3,10)后,下列说法错误 的是( ) A相关系数 r 变大 B残差平方和变大 C相关指数 R 2 变大 D解释变量 x 与预报变量 y的相关性变强 解析: 由散点图知,去掉D 后,x 与 y 的相关性变强,且为正相 关,所以 r 变大, R 2 变大,残差平方和变小 答案: B 二、填空题 6若一组观测值 (x1,y1),(x2,y
4、2),(xn,yn)之间满足 yibxi aei(i1,2, n),且 ei恒为 0,则 R2为_ 解析: 由 ei恒为 0,知 yiy i,即 yiy i0, 答案: 1 7x,y满足如下表的关系: x 0.20.61.01.21.41.61.82.02.2 y 0.040.3611.41.92.53.23.984.82 则 x,y 之间符合的函数模型为 _ 解析:通过数据发现 y的值与 x 的平方值比较接近,所以x,y之 间的函数模型为yx2. 答案: yx 2 8关于 x 与 y,有如下数据: x 24568 y 3040605070 有如下的两个模型: (1)y 6.5x17.5;(2
5、)y7x17.通过残差分 析发现第 (1)个线性回归模型比第 (2)个拟合效果好则R2 1_R 2 2, Q1_Q2(用大于,小于号填空, R,Q 分别是相关指数和残差平 方和) 解析: 根据相关指数和残差平方和的意义知R2 1R 2 2,Q1Q2. 答案: 三、解答题 9在实验中得到变量y与 x 的数据如下表所示: x 0.066 70.038 80.033 30.027 30.022 5 y 39.442.941.043.149.2 由经验知, y 与1 x之间具有线性相关关系,试求 y与 x 之间的回归 曲线方程,并预测x00.038 时,y0的值 解:令 u1 x,由题目所给数据可得下
6、表所示的数据: 序号uiyiu2 iuiyi 115.039.4225591 225.842.9665.641 106.82 330.041.09001 230 436.643.11 339.561 577.46 544.449.21 971.362 184.48 合计151.8215.65 101.566 689.76 计算得 b 0.29,a 34.32. 所以 y 34.320.29u. 所以试求回归曲线方程为y 34.320.29 x . 当 x00.038时,y034.320.29 0.38 41.95. 10关于 x 与 y 有以下数据: x 24568 y 3040605070
7、已知 x 与 y线性相关,由最小二乘法得b 6.5. (1)求 y 与 x 的线性回归方程; (2)现有第二个线性模型:y 7x17,且 R 20.82.若与(1)的线性 模型比较,哪一个线性模型拟合效果比较好,请说明理由 解:(1)依题意设 y与 x 的线性回归方程为 y 6.5xa . x 24568 5 5, y 3040605070 5 50,因为y 6.5xa 经过 ( x , y ), 所以 y与 x的线性回归方程为 y 6.5x17.5 . 所以 506.55a .所以a 17.5. (2)由(1)的线性模型得 yiyi与 yi y 的关系如下表所示: yiyi0.53.5106
8、.50.5 yi y 201010020 由于 R 2 10.845,R 20.82 知 R2 1R 2,所以(1)的线性模型拟合效 果比较好 B 级能力提升 1在研究身高和体重的关系时, 得到的结论是“身高解释了64% 的体重变化,而随机误差贡献了剩余的36%,所以身高对体重的效应 比随机误差的效应大得多”,则求得的相关指数R2( ) A0.36 B0.64 C0.32 D0.18 解析: 根据相关指数的意义知R20.64. 答案: B 2若某函数型相对一组数据的残差平方和为89,其相关指数为 0.95,则总偏差平方和为 _,回归平方和为 _ 解析: 因为 R 21 残差平方和 总偏差平方和
9、 , 0951 89 总偏差平方和 ,所以总偏差平方和为1 780;回归平方 和总偏差平方和残差平方和1 780891 691. 答案: 1 780 1 691 3某运动员训练次数与成绩之间的数据关系如下: 次数 x 303335373944 4650 成绩 y 3034373942464851 (1)作出散点图; (2)求出回归方程; (3)作出残差图; (4)计算相关指数 R 2; (5)试预测该运动员训练47 次及 55 次的成绩 解:(1)作出该运动员训练次数 (x)与成绩(y)之间的散点图,如图所 示,由散点图可知,它们之间具有线性相关关系 (2) x 39.25, y 40.875, 13 180, a y b x 0.003 88. 所以回归方程为 y 1.0415x0.003 88. (3)作残差图如图所示,由图可知,残差点比较均匀地分布在水平 带状区域中,说明选用的模型比较合适 (4)计算得相关指数 R 20.985 5,说明了该运动员的成绩的差异有 98.55%是由训练次数引起的 (5)由上述分析可知,我们可用回归方程y 1.041 5x0.003 88 作 为该运动员成绩的预报值 将 x47 和 x55 分别代入该方程可得y49 和 y57. 故预测该运动员训练47 次和 55 次的成绩分别为49 和 57.
链接地址:https://www.31doc.com/p-5598649.html