2019届高三数学备考冲刺140分问题42实际应用中的统计解答题含解析.pdf
《2019届高三数学备考冲刺140分问题42实际应用中的统计解答题含解析.pdf》由会员分享,可在线阅读,更多相关《2019届高三数学备考冲刺140分问题42实际应用中的统计解答题含解析.pdf(36页珍藏版)》请在三一文库上搜索。
1、问题 42 实际应用中的统计解答题问题 42 实际应用中的统计解答题 一、考情分析 概率统计在高考中扮演着很重要的角色,概率统计解答题是全国卷及多数省市高考数学必考内容,内容主要 涉及古典概型、相互独立事件的概率、条件概率、二项分布、正态分布、频率分布直方图、回归分析、离 散型随机变量的分布列、期望与方差的实际应用等.回顾近几年的高考试题,可以看出概率统计解答题,大多 紧密结合社会实际,以现实生活为背景设置试题,注重知识的综合应用与实际应用,作为考查实践能力的重 要载体,命题者要求考生会收集、整理、分析数据,能从大量数据中抽取对研究问题有用的信息,建立数学模 型,再应用数学原理和数学工具解决实
2、际问题.该类问题阅读量一般比较大,但难度多为中等或中等偏易. 二、经验分享 (1)明确频率分布直方图的意义,即图中的每一个小矩形的面积是数据落在该区间上的频率,所有小矩形的 面积和为 1. 利用分布列中各概率之和为 1 可求参数的值,此时要注意检验,以保证每个概率值均为非负 数对于统计图表类题目,最重要的是认真观察图表,从中提炼有用的信息和数据 (2)随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量稳定于均值的程度,它们从整体 和全局上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据一般先比较均值,若均值相同, 再用方差来决定 (3)解决正态分布问题有三个关键点:(1)对称
3、轴x;(2)标准差;(3)分布区间利用对称性可求指 定范围内的概率值;由,分布区间的特征进行转化,使分布区间转化为 3特殊区间,从而求出所 求概率注意只有在标准正态分布下对称轴才为x0. (4)判定两个变量正、负相关性的方法 画散点图 : 点的分布从左下角到右上角,两个变量正相关 ; 点的分布从左上角到右下角,两个变量负相关 相关系数:r0 时,正相关;r0 时,正相关; 0 时,负相关b b (5) 回归分析是处理变量相关关系的一种数学方法主要解决:确定特定量之间是否有相关关系,如果有 就找出它们之间贴近的数学表达式; 根据一组观测值,预测变量的取值及判断变量取值的变化趋势; 求出线性回归方
4、程线性回归分析问题的类型及解题方法 求线性回归方程 利用公式,求出回归系数 ,或待定系数法:利用回归直线过样本点的中心求系数b 利用回归方程进行预测,把线性回归方程看作一次函数,求函数值 利用回归直线判断正、负相关;决定正相关还是负相关的是系数 .b (6)回归方程的拟合效果,可以利用相关系数判断,当|r|越趋近于 1 时,两变量的线性相关性越强 (7)比较几个分类变量有关联的可能性大小的方法 通过计算K2的大小判断:K2越大,两变量有关联的可能性越大 通过计算|adbc|的大小判断:|adbc|越大,两变量有关联的可能性越大 (8)独立性检验的一般步骤 根据样本数据制成 22 列联表 根据公
5、式计算K2的观测值k. 比较k与临界值的大小关系,作统计推断 三、知识拓展三、知识拓展 四、题型分析四、题型分析 (一) 期望与方差的应用(一) 期望与方差的应用 数学期望反应的是随机变量取值的平均水平,而方差则是反应随机变量取值在其平均值附近的离散程度.现 代实际生活中,越来越多的决策需要应用数学期望与方差这思想来对事件发生大小的可能性进行评估,通 过计算分析可以比较科学地得出各个方案的预期效果及出现偏差的大小,从而决定要选择的最佳方案.品种 的优劣、仪器的好坏、预报的准确与否等很多问题都与这两个特征两量有关. (1)若我们希望实际的平均水平较理想,则先求随机变量 12 ,的期望,当 12
6、EE时,不应认为它们一定 一样好,需要用 12 ,DD来比较这两个随机变量的方差,确定它们的偏离程度. (2)若我们希望比较稳定性,应先考虑方差,再考虑均值是否相等或接近. 【例 1】例 3.7(2018 新课标 I 卷理 20)某工厂的某种产品成箱包装,每箱 200 件,每一箱产品在交付用 户之前要对产品作检验,如检验出不合格品,则更换为合格品检验时,先从这箱产品中任取 20 件作检验, 再根据检验结果决定是否对余下的所有产品作检验,设每件产品为不合格品的概率都为,且各 件产品是否为不合格品相互独立 (1)记 20 件产品中恰有 2 件不合格品的概率为,求的最大值点 (2)现对一箱产品检验了
7、 20 件,结果恰有 2 件不合格品,以(1)中确定的作为 的值已知每件产品 的检验费用为 2 元,若有不合格品进入用户手中,则工厂要对每件不合格品支付 25 元的赔偿费用 (i)若不对该箱余下的产品作检验,这一箱产品的检验费用与赔偿费用的和记为 ,求; (ii)以检验费用与赔偿费用和的期望值为决策依据,是否该对这箱余下的所有产品作检验? 【分析】【分析】 利用独立重复实验成功次数对应的概率,求得,之后对其求导,利用导数确 定其单调性,再求最大值点,注意; (2)先根据第一问的条件, 确定出, 在解 (i) 的时候,先求件数对应的期望, 之后应用变量之间的关系, 求得赔偿费用的期望;在解(ii
8、)的时候,就通过比较两个期望的大小,得到结果. 【解析】【解析】 (1)20 件产品中恰有 2 件不合格品的概率为.因此 . 令,得.当时,;当时,. 所以的最大值点为. (2)由(1)知,. (i)令 表示余下的 180 件产品中的不合格品件数,依题意知,即 .所以. (ii)如果对余下的产品作检验,则这一箱产品所需要的检验费为 400 元. 由于,故应该对余下的产品作检验. 【点评】随机变量的均值反映了随机变量取值的平均水平,方差反映了随机变量稳定于均值的程度,它们 从整体和全局上刻画了随机变量,是生产实际中用于方案取舍的重要理论依据一般先比较均值,若均值 相同,再用方差来决定 【小试牛刀
9、】【广东省江门市 2019 届第一次模拟】甲、乙两家外卖公司,其送餐员的日工资方案如下:甲 公司的底薪元,每单提成 元;乙公司无底薪,单以内(含单)的部分每单提成 元,大于单的部 分每单提成 元,假设同一公司送餐员一天的送餐单数相同,现从两家公司各随机抽取一名送餐员,并分别 记录其天的送餐单数,得到如下频数表: 甲公司送餐员送餐单数频数表 乙公司送餐员送餐单数频数表 (1) 若将大于单的工作日称为 “繁忙日” , 根据以上频数表能否在犯错误的概率不超过的前提下认为 “繁 忙日”与公司有关? (2)若将频率视为概率,回答下列两个问题:记乙公司送餐员日工资为 (单位:元) ,求 的分布列和 数学期
10、望;小王打算到甲、乙两家公司中的一家应聘,你会推荐小王去哪家?为什么? 参考公式和数据: 【解析】 (1)依题意得,公司与“繁忙日”列联表 , ,所以,能在犯错误的概率不超过的前提下认为“繁忙日”与公司有关 . (2)设乙公司送餐员送餐单数为 ,则当时,当时,当 时,当时,当时, . 所以, 的所有可能取值为、, 的分布列为: . 依题意,甲公司送餐员日平均送餐单数为 , 所以甲公司送餐员日平均工资为(元), 因为,故从更高收入角度考虑推荐小王去乙公司应聘;因为乙公司比甲公司繁忙,故从工作闲 适角度考虑推荐小王去甲公司应聘 (二)正态分布的应用 (二)正态分布的应用 正态分布随处可见,处处显现
11、着他神秘的身影.对于某一件事或者某个要达到的目标,很多很多的个体发挥 出来的水平大致上服从正态分布.也就是说,对于大量个体的发挥统计,常常能看到正态分布“冥冥之中” 束缚着整体的状态. 对于某个单独的单位,一般来说,对于“发挥出来的水平”这件事,也往往有波动的 效果,不管是机器、工具还是我们人本身:有的时候,超水平发挥了;有的时候正常发挥;有的时候又会 发挥失常.这种东西应该也可以抽象为围绕期望水平的正态分布. 而对于若干数据,包括发挥水平、排位 情况,但是没有整体数据的时候,如果能推测是正态分布的情形,就可以近似计算出分布函数来,然后去 估计其他的分布情况.这是反向推导的过程. 生产与科学实
12、验中很多随机变量的概率分布都可以近似地用 正态分布来描述.例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生 物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地 区的年降水量;以及理想气体分子的速度分量,等等. 【例 2】为了监控某种零件的一条生产线的生产过程,检验员每天从该生产线上随机抽取16个零件,并测量 其尺寸(单位 :cm) 根据长期生产经验,可以认为这条生产线正常状态下生产的零件的尺寸服从正态分布 2 ,N (1)假设生产状态正常,记X表示一天内抽取的16个零件中其尺寸在3 ,3 之外的零件数,求 1P X及X的数
13、学期望; (2) 一天内抽检零件中,如果出现了尺寸在3 ,3 之外的零件,就认为这条生产线在这一天的生 产过程可能出现了异常情况,需对当天的生产过程进行检查 ()试说明上述监控生产过程方法的合理性; ()下面是检验员在一天内抽取的16个零件的尺寸: 9.9510.129.969.9610.019.929.9810.04 10.269.9110.1310.029.2210.0410.059.95 经计算得 16 1 1 9.97 16 i i xx , 1616 222 11 11 ()(16)0.212 1616 ii ii sxxxx ,其中 i x为抽取的第i 个零件的尺寸,1 216i
14、, , 用样本平均数x作为的估计值,用样本标准差s作为的估计值,利用估计值判断是否需对当天 的生产过程进行检查?剔除 3 ,3 之外的数据,用剩下的数据估计和(精确到0.01) 附:若随机变量Z服从正态分布 2 ,N ,则330.9974PZ, 16 0.99740.9592, 0.0080.09 【分析】 【分析】 (1)先确定 160.0026XB, ,再利用EXnp求期望;(2)(i)判断监控生产过程的方法是否 合理,可通过一天内抽取的16个零件中,尺寸落 33, 之外概率的大小判断,(ii)剔除异常数据, 在利用公式求和. 【解析】 【解析】 (1)由题可知尺寸落在 33, 之内的概率
15、为0.9974,落在 33, 之外的概率 为0.0026 0 016 16 0C1 0.99740.99740.9592P X , 11010.95920.0408P XP X , 由题可知 160.0026XB, ,所以 160.00260.0416E X . (2)(i)尺寸落在 33, 之外的概率为0.0026,由正态分布知尺寸落 33, 之外为小 概率事件,因此上述监控生产过程的方法合理 (ii) 39.9730.2129.334 , 39.9730.21210.606 , 339.33410.606, ,因为 9.229.33410.606, , 所以需对当天的生产过程检查 因此剔除
16、9.22,剔除数据之后: 9.97 169.22 10.02 15 22222 2 9.95 10.0210.12 10.029.96 10.029.96 10.0210.01 10.02 22222 9.92 10.029.98 10.0210.04 10.0210.26 10.029.91 10.02 222221 10.13 10.0210.0210.0210.0410.0210.0510.029.9510.020.008 15 . 所以0.0080.09. 【点评】【点评】正态分布是概率统计中相对较独立的一个考点,且已经从冷点转化为热点,求解此类问题,一般从 , 入手,对于应用问题,要
17、注意从较大的阅读量中提取有用的信息.以下两类问题是正态分布中的基本问 题: (1)利用正态分布密度曲线的对称性研究相关概率问题,涉及的知识主要是正态曲线关于直线x对称,及 曲线与x轴之间的面积为 1. (2)利用 3原则求概率问题时,要注意把给出的区间或范围与正态变量的,进行对比联系,确定它们属 于(,),(2,2),(3,3)中的哪一个. 【小试牛刀】 【山东省济宁市 2019 届高三第一次模拟】某学校为了了解全校学生的体重情况,从全校学生 中随机抽取了 100 人的体重数据,结果这 100 人的体重全部介于 45 公斤到 75 公斤之间,现将结果按如下 方式分为 6 组:第一组45,50)
18、,第二组50,55),第六组70,75),得到如下图(1)所示的频率分布 直方图,并发现这 100 人中,其体重低于 55 公斤的有 15 人,这 15 人体重数据的茎叶图如图(2)所示,以 样本的频率作为总体的概率 (I)求频率分布直方图中的值; (II)从全校学生中随机抽取 3 名学生,记 X 为体重在55,65)的人数,求 X 的概率分布列和数学期望; (III)由频率分布直方图可以认为,该校学生的体重近似服从正态分布,其中若 ,则认为该校学生的体重是正常的试判断该校学生的体重是否正常?并 说明理由 【解析】 解:()由图(2)知,100 名样本中体重低于 50 公斤的有 2 人, 用样
19、本的频率估计总体的概率,可得体重低于 50 公斤的概率为, 则, 在上有 13 人,该组的频率为 0.13,则, 所以,即 c=0.07. ()用样本的频率估计总体的概率,可知从全体学生中随机抽取一人,体重在的概率为 0.0710=0.7,随机抽取 3 人,相当于三次独立重复试验,随机变量 X 服从二项分布, 则, , , , 所以,X 的概率分布列为: X0123 P0.0270.1890.4410.343 E(X)=30.7=2.1 ()由 N(60,25)得 由图(2)知. 所以可以认为该校学生的体重是正常的. (三) 用样本估计总体 (三) 用样本估计总体 频率分布直方图是高考考查的热
20、点,考查频率很高,题型有选择题、填空题,也有解答题,难度为低中 档用样本频率分布来估计总体分布的重点是频率分布表和频率分布直方图的绘制及用样本频率分布估计 总体分布;难点是频率分布表和频率分布直方图的理解及应用在计数和计算时一定要准确,在绘制小矩 形时,宽窄要一致通过频率分布表和频率分布直方图可以对总体作出估计频率分布直方图的纵坐标为 频率/组距,每一个小长方形的面积表示样本个体落在该区间内的频率;条形图的纵坐标为频数或频率,把 直方图视为条形图是常见的错误 【例 3】2018 年 9 月的台风“山竹”对我国多个省市的财产造成重大损害,据统计直接经济损失达亿元. 某青年志愿者组织调查了某地区的
21、个农户在该次台风中造成的直接经济损失,将收集的损失数据分成五 组:,(单位:元) ,得到如图所示的频率 分布直方图. (1)试根据频率分布直方图估计该地区每个农户的损失(同一组中的数据用该区间的中点值代表) ; (2) 台风后该青年志愿者与当地政府向社会发出倡议, 为该地区的农户捐款帮扶, 现从这户损失超过 元的农户中随机抽取 户进行重点帮扶,设抽出损失超过元的农户数为 ,求 的分布列和数学期望. 【分析】 (1)根据频率分布直方图计算每个农户的平均损失; (2)根据频率分布直方图计算随机变量 X 的可能取值,再求 X 的分布列和数学期望值 【解析】 (1)记每个农户的平均损失为 元,则 ;
22、(2)由频率分布直方图,可得损失超过 1000 元的农户共有(0.00009+0.00003+0.00003)20005015 (户) ,损失超过 8000 元的农户共有 0.000032000503(户) , 随机抽取 2 户,则 X 的可能取值为 0,1,2; 计算 P(X0), P(X1), P(X2), 所以 X 的分布列为; X012 P 数学期望为 E(X)0+1+2 【点评】用样本估计总体是统计的基本思想,而利用频率分布表和频率分布直方图来估计总体则是用样本 的频率分布去估计总体分布的两种主要方法分布表在数量表示上比较准确,直方图比较直观 【小试牛刀】中国农业银行开始为全国农行
23、ATM 机安装刷脸取款系统.某农行营业点为调查居民对刷脸取款 知识的了解情况,制作了刷脸取款知识有奖调查问卷,发放给 2018 年度该行的所有客户,并从参与调查且年 龄(单位:岁)在25,55内的客户中随机抽取 100 名给予物质奖励,再从中选出一名客户参加幸运大抽奖.调 查结果按年龄分成 6 组,制作成如下的频数分布表和女客户的年龄茎叶图,其中abc=245. 年 龄/ 25,30)30,35)35,40)40,45)45,50)50,55 岁 频 数/ 人 5abc1525 女客户的年龄茎叶图 幸运大抽奖方案如下:客户最多有两次抽奖机会,每次抽奖的中奖率均为 ,第一次抽奖,若未中奖,则抽奖
24、结 束.若中奖,则通过抛掷一枚质地均匀的硬币,决定是否继续进行第二次抽奖.规定:抛出的硬币,若反面朝上, 则客户获得 5000 元奖金,不进行第二次抽奖;若正面朝上,客户需进行第二次抽奖,且在第二次抽奖中,如果 中奖,则获得奖金 10000 元,如果未中奖,则所获得的奖金为 0 元. (1)求a,b,c的值,若分别从男、女客户中随机选取 1 人,求这 2 人的年龄均在40,45)内的概率; (2)若参加幸运大抽奖的客户所获奖金(单位:元)用X表示,求X的分布列与数学期望E(X). 【解析】(1)由频数分布表知,a+b+c=100-45=55. 因为 abc=245, 所以 a=55=10,b=
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2019 届高三 数学 备考 冲刺 140 问题 42 实际 应用 中的 统计 解答 解析
链接地址:https://www.31doc.com/p-4124887.html