《2018年高考数学总复习统计与统计案例.pdf》由会员分享,可在线阅读,更多相关《2018年高考数学总复习统计与统计案例.pdf(13页珍藏版)》请在三一文库上搜索。
1、第三节统计与统计案例 考纲解读 1. 理解随机抽样的必要性和重要性。 2. 会用简单随机抽样方法从总体中抽取样本;了解分层抽样和系统抽样方法。 3. 了解分布的意义和作用,会列频率分布表,会画出频率分布直方图、频率折线图、 茎叶图,理解它们各自的特点。 4. 理解样本数据标准差的意义和作用,会计算数据标准差。 5. 能从样本的频率分布估计总体分布,会用样本的基本数字牲估计总体的基本数字特 征,理解用样本估计总体的思想。 6. 会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题。 7. 会作两个有关联变量的数据的散点图,会利用散点图认识变量间的相关关系。 8. 了解最小二乘法的思想
2、,能根据给出的线性回归方程系数公式建立线性回归方程。 9. 了解常见的统计方法,并能应用这些方法解决一些实际问题。 (1) 独立性检验 了解独立性检验( 只要求 22 列联表 ) 的基本思想、方法及其简单应用。 (2) 回归分析 了解回归分析的基本思想、方法及其简单应用。 命题趋势探究 1. 本节内容是高考必考内容,以选择题、填空题为主。 2. 命题内容为:(1) 三种抽样 ( 以分层抽样为主) ;(2) 频率分布表和频率分布直方图的 制作、识图及运用。(1)(2)有结合趋势,考题难度中下。 3. 统计案例为新课标教材新增内容,考查考生解决实际问题的能力。 知识点精讲 一、抽样方法 三种抽样方
3、式的对比,如表13-7 所示。 类型共同点各自特点相互关系使用范围 简单随机抽样 抽 样 过 程 都 是 不放回抽样, 每 个 个 体 被 抽 到 的机会均等, 总 体容量 N,样本 容量 n,每个个 体 被 抽 到 的 概 率 n P N 从总体中随机逐个抽取总体容量较小 系统抽样 总体均分几段,每段T 个, 第一段取 a1, 第二段取 a1+T, 第三段取 a1+2T, 第 一 段 简 单 随 机 抽 样 总 体 中 的 个 体 个数较多 分层抽样 将总体分成n 层,每层 按比例抽取 每 层 按 简 单 随 机 抽 样 或 系 统 抽样 总 体 由 差 异 明 显 的 几 部 分 组 成
4、二、样本分析 (1) 样本平均值: 1 1 n i i xx n 。 (2) 样本众数:样本数据中出现次数最多的那个数据。 (3) 样本中位数:将数据按大小排列,位于最中间的数据或中间两个数据的平均数。 (4) 样本方差:() 22 1 1 n i i sxx n 。 众数、 中位数、 平均数都是描述一组数据集中趋势的量,方差是用来描述一组数据波动 情况的特征数。 三、频率分布直方图的解读 (1) 频率分布直方图的绘制 由频率分布表求出每组频数ni; 求出每组频率 i i n P N ( n 为样本容量 ) ; 列出样本频率分布表; 画出样本频率分布直方图,直方图横坐标表示各组分组情况,纵坐标
5、为每组频率与组 距比值,各小长方形的面积即为各组频率,各小长方形的面积总和为1。 (2) 样本估计总体 步骤:总体抽取样本频率分布表频率分布直方图估计总体频率分布。 样本容量越大, 估计越精细, 样本容量无限增大,频率分布直方图无限无限趋近概率分 布密度曲线。 (3) 用样本平均数估计总体平均数,用样本标准差估计总体标准差。 公式: aXbaxb ,s 2( aX+b)= a2 s 2 (X) 。 四、线性回归 线性回归是研究不具备确定的函数关系的两个变量之间的关系( 相关关系 ) 的方法。 对于一组具有线性相关关系的数据( x1, y1),( x2, y2) ,( xn, yn) ,其回归方
6、程ybxa 的求法为 ()() () 11 2 22 11 nn iiii ii nn ii ii xxyyx ynx y b xxxnx aybx 其中, 1 1 n i i xx n , 1 1 n i i yy n ,( x , y) 称为样本点的中心。 步骤: 画散点图, 如散点图中的点基本分布在一条直线附近,则这条直线叫这两个变量 的回归直线,直线斜率k0,称两个变量正相关;k10.828 ,有 99.9%把握称“ A 取 A 1或 A2”对“ B 取 B1,B2”有关系; 若 10.828K 26.635 ,有 99% 把握称“ A取 A 1或 A2”对“ B 取 B1,B2”有关
7、系; 若 6.635K 23.841 ,有 95% 把握称“ A 取 A 1或 A2”对“ B 取 B1,B2”有关系; 若 K 2 3.841 ,没有把握称A 与 B 相关。 题型归纳及思路提示 题型 181 抽样方式 思路提示 根据所抽取的对象与要求,若抽取的对象中有明显差异,考虑用分层抽样,否则选择简 单随机抽样或系统抽样。当总体中的个体较少时,常采用简单随机抽样;当总体中的个体较 多时,常采用系统抽样。 例 13.16(2012天津理 9) 某地区有小学150 所,中学 75 所,大学 25 所。现采用分层抽样的方法从这些学校中抽 取 30 所学校对学生进行视力调査,应从小学中抽取所学
8、校,中学中抽取所学 校。 解析:本地区共有学校150+75+25=250( 所 ) ,所以从小学中应抽取 150 3018 250 ( 所) , 从中学中抽取 75 309 250 ( 所) 。 变式 1 (2012山东理 4) 采用系统抽样方法从960 人中抽取32 人做问卷调查, 为此将他们随机编号为1, 2, 960,分组后在第一组采用简单随机抽样的方法抽到的号码为9。抽到的 32 人中,编号落入 区间 1,450的人做问卷A,编号落入区间451,750的人做问卷B,其余的人做问卷C。则 抽到的人中,做问卷B 的人数为 ( )。 A. 7 B. 9 C. 10 D. 15 变式 2 某校
9、共有学生2000 名,各年级男、女生人数如表13-9 所示,已知在全校学生 中任取一名, 抽到二年级女生的概率为0.19 ,现用分层抽样的方法,在全校抽取64 名学生, 则应在三年级抽取的学生人数为( )。 表 13-9 一年级二年级三年级 女生373 xy 男生377 370 z 变式 3 某企业三月中旬生产A,B,C 三种产品其3000 件,根据分层抽样的结果,企 业统计员制作了统计表格,如表13-10 所示,由于不小心,表格中的A,C 产品的有的有关 数据被污染看不清楚,统计员记得A 产品样本容量比C 产品的样本容量多10,由此可得C 产品数量为 _。 表 13-10 产品类型ABC 产
10、品数量 (件) 1300 产品样本数量(件) 130 题型 182 样本分析用样本估计总体 思路提示 对样本进行分析并用样本估计总体,包括用样本数字特征估计总体数字特征和用样本的 频率分布估计总体的频率分布。在进行样本分析时,应从统计图表中获取数据。体现在以下 几个方面: (1) 在频率分布直方图中,长方形面积 =组距 频率 组距 =频率,即随机变量的概率;(2) 对于频数、频率、样本容量,已知其二必可求第三个;(3) 随机变量在各组数据内的频数之 和为样本容量。 例 13.17(2013广东理 17) 某车间共有12 名工人,随机抽取6 名,他们某日加工零件个数的茎叶图如图13-16 所 示
11、,其中茎为十位数,叶为个位数。 17 9 20 1 5 30 13-16图 (1) 根据茎叶图计算样本均值; (2) 日加工零件个数大于样本均值的工人为优秀工人,根据茎叶图推断该车间12 名工人 中有几名优秀工人; (3) 从该车间12 名工人中,任取2 人,求恰有1 名优秀工人的概率。 分析:阅读茎叶图得出样本数据,利用平均数公式计算出样本均值。(2) 根据样本算出 优秀工人的比例, 再估计 12 人中优秀工人的个数。(3) 用组合数公式求出所有可能的组合的 个数和符合条件“恰有1 名优秀工人”的组合的个数,利用古典概型概率公式进行计算。 解析: (1) 由茎叶图可知,样本数据为17,19,
12、20,21,25,30,则样本均值 171920212530 22 6 x,故样本均值为22。 (2 ) 日加工零件个数大于样本均值的工人有2 名,故优秀工人的频率为 21 63 ,该车间 12 名工人中优秀工人大约有 2 124 6 ( 名) ,故该车间约有4 名优秀工人。 (3) 记“恰有1 名优秀工人”为事件A,其包含的基本事件个数为C 1 4 C1 8=32,所有基本 事件的总数为C 2 12=66,由古典概型概率公式,得 () 3216 6633 P A。所以恰有1 名优秀工人的 概率为 16 33 。 变式 1 (2012陕西理 6) 从甲乙两个城市分别随机抽取16 台自动售货机,
13、对其销售额进行统计,统计数据用茎 叶图表示 (如图 13-17 所 示 ) ,设甲乙两组数据的平均数分别为x甲,x乙,中位数分别为m甲, m 乙,则 ( ) 。 8 6 50 88 4 0 010 2 8 7 5 220 2 33 7 8 0 031 2 4 4 8 3142 3 8 13-17 甲乙 图 A. x甲m乙B. x甲 x乙,m甲m乙D. x甲x乙,m甲6.635 ,所以有 99% 的把握认为该地区的老年人是否需要志愿者帮助与性别 有关。 (3) 由(2) 的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出, 该地区男性老年人与女性老年人中需要帮助的比例有明显差异,
14、因此在调查中, 先确定该地 区老年人中男、 女的比例, 再把老年人分成男、女两层并采用分层抽样方法比采用简单随机 抽样方法更好。 变式 1 为比较注射A,B 两种药物产生的皮肤疱疹的面积,选 200只家兔作试验, 将这 200 只家兔随机地分成两组,每组 100 只, 其中一组注射药物A, 另一组注射药物B。 表 13-18 和表 13-19 所示的分别是注射药物A 和药物 B后皮肤疱疹面积的频率分布( 疱疹面积单位: mm 2) 。 表 13-18 疱疹60,65) 65,70) 70,75) 75,80 频数30 40 20 10 表 13-19 疱疹面积60,65) 65,70) 70,
15、75) 75,80 80,85) 频数10 25 20 30 15 (1) 完成图 13-22 和图 13-23 所示的分别注射药物A,B 后皮肤疱疹面积的频率分布直 方图,并比较注射两种药物后疱疹面积的中位数大小; (2)完成表13-20 所示的 22 列联表,并回答能否有99.9%的把握认为注射药物A 后的疱 疹面积与注射药物B 的疱疹面积有差异. 疱疹面积小于70mm 2 疱疹面积不小于 70mm 2 合计 注射药物Aa= b= 注射药物Bc= d= 合计 附: 2 2 () ()()()() n adbc K ab cdac bd . 0.08 0.07 0.06 0.05 0.04
16、0.03 0.02 0.01 频率 /组距 0 60 65 70 75 80 85 疱疹面积 图13-22 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 频率 /组距 0 60 65 70 75 80 85 疱疹面积 图13-23 2 ()0.1000.0500.0250.0100.001 2.7063.8115.0216.63510.828 P Kk k 变式 2 (2012 辽宁理 19) 电视传媒公司为了解某地区电视观众对某类体育节目的收视情况, 随机抽取了100 名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间 的频率分布直方图: 将
17、日均收看该体育节目时间不低于40 分钟的观众称为“ 体 育迷 ” (1)根据已知条件完成下面的22列联表,并据此资料 你是否认为 “ 体育迷 “ 与性别有关? 非体育迷体育迷合计 男 女10 55 合计 (2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法 每次抽取1 名观众,抽取3 次,记被抽取的3 名观众中的 “ 体育迷 “ 人数为 X.若每次抽取的 结果是相互独立的,求 X的分布列,期望E X 和方差 D X 附: 2 112212212 1+2+1+2 - = n n nn n n nn n , 2 Pk 0.05 0.01 k3.841 6.635 最有
18、效训练55(限时 40 分钟 ) 1变量 X与 Y的卡方统计量K 2 的值,下列说法正确的是() AK 2 越大, “ X 与 Y有关系 ” 可信度越小 BK 2 越小, “ X与 Y有关系 ” 可信度越小 CK 2 越接近 0,“ X与 Y无关 ” 程度越小 DK 2 越大, “ X与 Y无关 ” 程度越大 2甲乙两名同学在5 次体育测试中的成绩如图13-25 所示,则有() Axx 甲乙,乙比甲稳定Bxx甲乙,甲比乙稳定 Cxx甲乙,乙比甲稳定 Dxx甲乙,甲比乙稳定 87278 6828 2915 13-25 十位 甲乙 数字 个位数字个位数字 图 3为了了解某地区高三学生的身体状况,抽
19、查了该地区100 名 17.518 岁的男生体重(千 克) ,得到频率分布直方图(如图 13-26 所示).由图知这100 名学生在56.5,64.5)的学生人 数为() A20 B30 C40 D50 4设两个变x 和 y 之间具有线性相关关系,它们的相关系数是r, y关于 x 的回归直线的斜 率是 b,纵截距是a,那么必有() Ab 与 r 符号相同Ba 与 r 符号相同 Cb 与 r 符号相反Da 与 r 符号相反 5通过随机询问110 名性别不同的大学生是否爱好某项运动,得到台表13-23 所示的22 列联表 . 表 13-23 男女总计 爱好40 20 60 不爱好20 30 50
20、总计60 50 100 由 2 2 () ()()()() n adbc K ab cdac bd 算得: 2 2 110(40302020) 7.8 60506050 K. 附表 13-24: P( 2 Kk) 0.050 0.010 0.001 k3.841 6.635 10.828 参照表 13-24,得到正确的结论是() A在犯错误的概率不超过0.1%的前提下,认为“ 爱好该项运动与性别有关” B在犯错误的概率不超过0.1%的前提下,认为“ 爱好该项运动与性别无关” C有 99%以上的把握认为“ 爱好该项运动与性别有关” D有 99%以上的把握认为“ 爱好该项运动与性别无关” 6设 1
21、122 (,),(,),(,) nn x yxyxy是娈量 x 和 y 的 n 个样本点,直线l 是由这些样本点通过 最小二乘法得到的线性回归直线(如图13-27 所示) ,以下结论中正确的是() Ax 和 y 的相关系数为直线l 的斜率 Bx 和 y 的相关系数在0 到 1 之间 C当 n 为偶数时,分布在l 两侧的样本点的个数一定相同 D直线 l 通过点( , )x y 7某学校高一、高二、高三年级的学生人数之比为3:3:4,现用分层抽样的方法从该校 高中三个年级的学生中抽取容量为50 的样本,则应从高二年级抽取名学生 . 8某学校食堂随机调查了一些学生是否因距离远近而选择食堂就餐的情况,
22、经计算得到 K 2=4.932.所以判定距离远近与选择食堂有关系,那么这种判断出错的可能性为 . 附表 13-25: P( 2 Kk) 0.050 0.010 0.001 k3.841 6.635 10.828 9某数学老师身高176cm,他爷爷,父亲,儿子的身高分别是173cm,170cm 和 182cm, 因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高是 Cm 10已知样本X: 10 8 8 10 13 8 10 12 11 7 8 9 11 9 12 9 10 11 12 12 则: (1)x; (2) 2 ( )sx. 11为调查某社区居民的业余生活状况,研究
23、这一社区居民在20:0022:00 时间段的休 闲方式与性别关系,随机调查了该社区80 人,得到下面的数据表(如表13-26 所示) . 表 13-36 休闲方式 性别 看电视看书合计 男10 50 60 女10 10 20 合计20 60 80 (1)将此样本的频率估计为总体的概率,随机调查3 名在该社区的男性,设调查的3 人在 这一时间段以看书为休闲方式的人数为随机变量X,求 X的分布列和数学期望; (2)根据以上数据,能否有99%的把握认为 “ 在 20:0022: 00 时间段居民的休闲方式与 性别有关系 ” ? y l Ox 图13-27 参考公式: 2 2 () ()()()() n adbc K ab cdac bd ,其中 n=a+b+c+d. 参考数据(如表13-27) P( 2 Kk) 0.15 0. 10 0.05 0.025 0.010 k2.072 2.706 3.841 5.024 6.635 12某种产品的广告费支出现x 与销售额y(单位:万元)之间有如表13-28 所示的对应数 据: 表 13-28 x2 4 5 6 8 y30 40 60 50 70 (1)画出散点图; (2)求回归直线方程; (3)若实际销售额不低于82.5 万元,则广告费支出最少是多少万元?
链接地址:https://www.31doc.com/p-4729628.html