第二章计量资料的统计描述.ppt
《第二章计量资料的统计描述.ppt》由会员分享,可在线阅读,更多相关《第二章计量资料的统计描述.ppt(63页珍藏版)》请在三一文库上搜索。
1、第二章 计量资料的统计描述,本章在临床资料处理中的用途,资料整理阶段,判断资料适合何种方法 分析的初步阶段,对变量的特点进行描述 (求出均数和标准差)为假设检验做准备,基本内容,数值变量资料的统计分析包括: 统计描述和统计推断。 统计描述:通过对资料的原始数据选用恰当的特征性统计指标,并选用合适的统计表、统计图正确地描述资料的分布规律与数量特征; 统计推断:用样本的信息去推断总体特征,如由样本统计量计算总体参数的置信区间或作差别有无统计学意义的检验等则属统计推断的范畴。,model-1:不校正;model-2:校正年龄和性别;model-3:校正年龄、性别、吸烟和饮酒;model-4:校正年龄
2、、性别、吸烟、饮酒和BMI ;model-5:校正年龄、性别、吸烟、饮酒和WHR,表4 SCL-90因子分3分人数分布情况,1、什么类型资料? 2、健康女性总胆固醇的分布类型? 3、如何描述这些女性总胆固醇的分布特征?,101名健康女性总胆固醇(mmol/L)的测量结果,第一节 频数分布,一、频数分布表 整理原始数据的一种工具,用来表示数据各观察值在不同取值区间出现的频数分布情况。 1、求极差(R):最大值与最小值之差 R=5.71-2.35=3.36mmol/L 2、确定组段数和组距: i=3.36/10=0.3360.30,3、根据组距写出组段:下限L、上限为U,变量X值的归组统一为LXU
3、 *最后一个组段写出上限和下限以外,其他组段只写出下限 4、分组划记并统计频数,二、频数分布图,1、描述频数分布的类型: 对称分布、偏态分布(正负偏态分布) (1)对称分布 :若各组段 的频数以频数最多组段为中心 左右两侧大体对称, 就认为该资料是对称分布,三、频数表和频数分布图的用途,(2)偏态分布 : 1)右偏态分布也称正偏态分布: 右侧的组段数多于左侧的组段数, 频数向右侧拖尾,2)左偏态分布也称负偏态分布:左侧的组段数多于右侧的组段数,频数向左侧拖尾,2、描述频数分布的特征: 1)变异范围在2.305.90mmol/L; 2)有明显的分布规律,主要集中在 3.504.70mmol/L,
4、尤以3.804.10mmol/L组 段的人数最多,且基本对称。 3、便于发现一些特大或特小的离群值。 4、便于进一步统计分析和处理。,第二节 集中趋势的描述,一、算术均数(mean) 资料呈单峰的正态或近似正态分布 1、直接计算法:,2、频数表法: 直接法和频数表法的差异主要是归组误差 资料呈正态分布时,均数位于分布的中央。,有研究者测定8人血清的抗体效价分别为1:200,1:25,1:400,1:800,1:50,1:100,1:50,1:25,求平均抗体滴度。该研究者用倒数求均数,得平均抗体低度为1:206.25。 1)资料的类型? 2)该研究者对资料的描述是否正确? 3)如何描述该资料的
5、集中趋势?,二、几何均数 (geometric mean),等比级资料和原始数据分布不对称,经对数转换后呈正态分布或近似正态分布资料 (单峰的正偏态) 免疫学指标 1、小样本:倍数关系 2、大样本:频数表-正偏态,一组观察值的几何均数总是算术均数,几何均数应用注意事项 1、几何均数常用于等比级资料或对数正态分布资料。 2、观察值中有0或负值,则不宜直接使用几何均数。 3、观察值一般同时不能有正值和负值。若全是负值,计算时可先将负号去掉,得出结果后再加上负号。,某医师观察9名食物中毒患者进餐发病的时间分别为2,5,3,4,4,6,17,3,2小时。 中位数:将一组观察值从小到大排序后,居于中间位
6、置的那个值或两个中间值的平均值。 n 奇数时,M=X(n+1)/2 n 偶数时,M=X(n/2)+X(1+n/2) /2 百分位数:将N个观察值从小到大依次排列,再分成100等份,对应于X%位的数值即为第X百分位数。中位数是百分位的特殊形式。 应用:偏态资料,开口资料,三、中位数与百分位数,2、频数表法计算中位数和百分位数 观察例数较多或频数表资料,Lx、ix、f x分别为 Px所在组段的下限、组距和频数; fx为小于L的各组段的累计频数, n为总例数,1、中位数可用于任何分布的资料。 对于正态分布资料,中位数等于均数; 对于对数正态分布资料,中位数等于几何均数。 2、中位数不受极端值得影响,
7、因此,实际工作中主要用于偏态分布资料、两端无确切值或分布不明确的资料。,四、调和平均数,对n个性质相同的定量数据分别取倒数变换后,按算术平均值计算,然后再求其倒数所得的结果。 应用: 一组性质相同的呈极严重正偏态分布,五、众数,N个性质相同的定量数据中出现次数最多的那个数. 实际应用很少,算术均数、几何均数、调和均数:要每一个数据的具体值计算出来; 中位数和众数只需要知道数据的个数和大小就可确定 计算算术平均值和几何平均值的资料:可以计算“标准差”,可以解释更多的问题。 当一个定量资料可以用这两种平均指标之一来处理时,应尽量选用它们。 只有在实在没有办法的时候,才选用调和平均值和中位数; 由于
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第二 计量 资料 统计 描述
链接地址:https://www.31doc.com/p-2260473.html