第4章抽样误差与假设检验ppt课件.ppt
《第4章抽样误差与假设检验ppt课件.ppt》由会员分享,可在线阅读,更多相关《第4章抽样误差与假设检验ppt课件.ppt(23页珍藏版)》请在三一文库上搜索。
1、 第四章 抽样误差与假设检验 (Sampling Error and Hypothesis Test) 哈尔滨医科大学 李康 第一节 均数的抽样误差与标准误 一、均数的抽样误差 在医学研究中,绝绝大多数情况是由样样本信息 研究总总体。由于个体存在差异,因此通过样过样 本推 论总论总 体时时会存在一定的误误差,如样样本均数 往往 不等于总总体均数 ,这这种由抽样样造成的样样本均数与 总总体均数的差异称为为抽样误样误 差。对于抽样研究, 抽样误差不可避免。 二、抽样误差的分布 理论论上可以证证明:若从正态总态总 体 中, 反复多次随机抽取样样本含量固定为为n 的样样本,那 么这这些样样本均数 也服
2、从正态态分布,即 的总总体 均数仍为为 ,样样本均数的标标准差为为 。 抽样分布 抽样分布示意图 中心极限定理: 当样样本含量很大的情况下,无论论原始测测量变变量服 从什么分布, 的抽样样分布均近似正态态。 抽样分布 抽样分布示意图 三、标准误(Standard Error) 样本均数的标准差称为标准误。样样本均数的 变变异越小说说明估计计越精确,因此可以用标准误 表示抽样误差的大小: 实际中总体标准差 往往未知,故只能求 得样本均数标准误的估计值 : 例4.1 在某地随机抽查成年男子140人,计算得红 细胞均数4.771012/L,标准差0.38 1012/L ,试计 算均数的标准误。 标准
3、误是抽样分布的重要特征之一,可用于衡 量抽样误差的大小,更重要的是可以用于参数的区 间估计和对不同组之间的参数进行比较。 第二节 总体均数的估计 一、可信区间的概念(Confidence Interval) 区间估计:指按预先给定的概率,计算出一个区间, 使它能够包含未知的总体均数。事先给定的概率 称为可信度,通常取 。 参数估计 点估计:不考虑抽样误差,如 区间估计:考虑抽样误差 二、可信区间的计算 (一) 已知 一般情况 其中 为标准正态分布的双侧界值。 可信区间: 标准正态分布 (二) 未知 通常未知,这时可以用其估计量S 代替,但 已不再服从标准正态分布,而是服 从著名的 t 分布。
4、图4-2 不同自由度的 t 分布图 可信区间的计算: 计算可信区间的原理与前完全相同,仅仅是两 侧概率的界值有些差别。即 可信区间: 需要注意:在小样本情况下,应用这一公式的 条件是原始变量服从正态分布。在大样本情况下 (如n100),也可以用 替换 近似计算。 例4.2 某医生测得25名动脉粥样硬化患者血浆 纤维蛋白原含量的均数为3.32 g/L,标准差为0.57 g/L,试计算该种病人血浆纤维蛋白原含量总体均数 的95%可信区间。 下限: 上限: 例4.3 试计算例4.1中该地成年男子红细胞总体 均数的95%可信区间。 本例属于大样本,可采用正态近似的方法计算 可信区间。因为 ,则95%可
5、 信区间为: 下限 : 上限 : 三、模拟实验 模拟抽样成年男子红细胞数。设定: 产生100个随机样本,分别计算其95%的可信区间, 结果用图示的方法表示。从图可以看出:绝大多数 可信区间包含总体参数 ,只有6个可信区间 没有包含总体参数(用星号标记)。 图4-2 模拟抽样成年男子红细胞数100次的95%可信区间示意图 * * * * * 第三节 假设检验的意义和步骤 (Hypothesis Test) 统计统计 推断的另一个重要内容,目的是通过样 本数据比较总较总 体参数之间间有无差别别。 一、假设检验设检验 的基本思想 例4.4 使用黑加仑油软胶囊治疗高脂血症, 30名高脂血症患者治疗前后
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 抽样误差 假设检验 ppt 课件
链接地址:https://www.31doc.com/p-2113183.html