医学医学统计学PPT课件.ppt
《医学医学统计学PPT课件.ppt》由会员分享,可在线阅读,更多相关《医学医学统计学PPT课件.ppt(40页珍藏版)》请在三一文库上搜索。
1、第三篇第三篇 医学统计学方法医学统计学方法 Statistical Methods in Medicine1 1第九章数值变量资料的统计分析第九章数值变量资料的统计分析第一节第一节 数值型资料的统计描述数值型资料的统计描述第二节第二节 正态分布和参考值范围的估计正态分布和参考值范围的估计第三节第三节 数值型资料的统计推断数值型资料的统计推断第四节第四节 t检验和检验和u检验检验第五节第五节 方差分析方差分析2 2 terminologystatistical descriptionstatistical description统计描述统计描述statistical inferencestati
2、stical inference统计推断统计推断parameter estimationparameter estimation参数估计参数估计Frequency distributionFrequency distribution频数分布频数分布frequency table频数表频数表arithmetic Mean,averagearithmetic Mean,average算术平均值算术平均值算术平均值算术平均值standard deviationstandard deviation标准差标准差variance方差方差range极差,全距,范围极差,全距,范围geometric mean
3、几何平均值几何平均值median中位数中位数normal distributionnormal distribution正态分布正态分布正态分布正态分布reference range参考值范围参考值范围3 3统计分析包括统计分析包括统计描述统计描述和和统计推断统计推断两大部分。两大部分。l统计描述统计描述(statistical description)是用统计指标、统是用统计指标、统计表和统计图描述资料的分析规律及其数量特征;计表和统计图描述资料的分析规律及其数量特征;l统计推断统计推断(statistical inference)包括总体参数估计和包括总体参数估计和假设检验两个内容。假设检
4、验两个内容。参数估计参数估计:是用样本统计量估计总体参数所在范围。是用样本统计量估计总体参数所在范围。假设检验假设检验:是利用样本的实际资料来检验事先对总体某是利用样本的实际资料来检验事先对总体某些数量特征所作的假设是否成立。些数量特征所作的假设是否成立。4 4第一节第一节 数值型变量资料的统计描述数值型变量资料的统计描述例例9.12002年某市年某市150名名2029岁正常男子的岁正常男子的尿酸浓度尿酸浓度(mol/L),资料见表资料见表9-1。如何进行如何进行统计描述?统计描述?5 5362.6359.7285.9300.2333.6334.0288.8338.5341.9344.6337
5、5298.3364.2367.1338.1316.9332.7324.0282.6369.8398.7338.7308.9392.1368.7352.6378.2346.1278.6318.3323.2322.6382.1322.6309.6352.0372.5399.8335.6341.1371.0355.9362.7368.1332.4405.6328.8358.8405.9362.7316.3338.7402.6379.4329.6354.6331.4349.6419.5324.6329.8357.8312.0313.6338.7328.6291.3329.7361.8392.4414.
6、9319.7327.6395.8358.9289.4366.2387.4298.4408.7389.8362.5354.9352.7316.6348.9348.7401.6334.6308.9367.0345.6401.6357.1304.6338.5388.2355.8329.4321.1320.4313.5339.8409.4387.4378.5392.0352.7376.2388.4344.6308.6347.0428.7369.1311.4376.3349.4289.2366.8371.0387.5413.6348.7392.7401.0313.6366.8387.2319.7329.
7、4357.5348.5346.8406.6357.6338.7341.6349.8289.4366.2357.5298.4336.8387.5342.3366.7387.6332.7324.0表表9-12002年某市年某市150名名2029岁正常男子的尿酸浓度岁正常男子的尿酸浓度(mol/L)6 6统计描述的内容:统计描述的内容:一、制频数一、制频数(分布分布)表表(表表9-2)和频数分布图和频数分布图(图图9-1)频数表的用途频数表的用途(1)揭示资料的分布特征和分布类型揭示资料的分布特征和分布类型(2)便于发现某些特大或特小的可疑值便于发现某些特大或特小的可疑值(3)便于进一步计算便于进一
8、步计算统计统计指标和统计分析处理指标和统计分析处理二、计算统计指标二、计算统计指标(1)计算平均值计算平均值代表一组资料的平均水平;代表一组资料的平均水平;(2)计算标准差计算标准差-反映资料的离散程度。反映资料的离散程度。三、绘制统计表和统计图三、绘制统计表和统计图7 7一、编制频数分布表:制表步骤:一、编制频数分布表:制表步骤:(1)求求极差极差或全距或全距(range):R=Xmax Xmin本例,本例,R=428.7278.6150.1(mol/L)。(2)决定组数、组段数和划分组距决定组数、组段数和划分组距(class interval):根据样本含量的多少确定组数,一般设根据样本含
9、量的多少确定组数,一般设815组。组。组段数组段数=取整取整(极差极差/组数组数)。本例:组段数本例:组段数=取整取整(150.1/10)=15.01 15划分组距:每组段的起点和终点分别称为划分组距:每组段的起点和终点分别称为下界下界和和上界上界。组距:本组内组距:本组内的的上界和下界上界和下界之差。之差。组段的划分组段的划分2702702852853003003153153303303453453603603753753903904054054204354204351 12 23 34 45 56 67 78 89 9101011118 8(3)列频数表:按上述组段列频数表:按上述组段序列
10、制成表的形式,采用序列制成表的形式,采用划记法或计算机将原始数划记法或计算机将原始数据汇总,得出各组段中所据汇总,得出各组段中所包含的观察例数,即为频包含的观察例数,即为频数,如表数,如表9-2的第的第(2)栏。栏。将各组段及其相应的频数将各组段及其相应的频数列成表格,即为频数表列成表格,即为频数表(frequency table),如,如表表9-2。所绘的图形见图。所绘的图形见图9-1。表表9-22002年某市年某市150名名2029岁岁正常男子的尿酸浓度的频数分布正常男子的尿酸浓度的频数分布尿酸浓度尿酸浓度(mol/L)频数频数频数频数频率频率频率频率(%)(%)2702702 21.33
11、1.332852859 96.006.0030030011117.337.33315315222214.6714.67330330242416.0016.00345345272718.0018.00360360202013.3313.33375375151510.0010.0039039011117.337.334054058 85.335.334204354204351 10.670.67合计合计合计合计150150100.00100.009 9资料的分布类型:资料的分布类型:1.对称分布或正态分布;对称分布或正态分布;2.偏态分布:高峰在左侧或右侧;偏态分布:高峰在左侧或右侧;3.不规则分
12、布:分布很散,无明显高峰不规则分布:分布很散,无明显高峰1010二、计算平均值二、计算平均值代表平均资料的平均水平代表平均资料的平均水平1.平均值的种类:平均值的种类:(一一)算术均算术均值值(arithmetic mean,average):常用常用 表表示样本均示样本均值值,希腊字母,希腊字母表示总体均表示总体均值值。适用于对称分。适用于对称分布的数值型变量资料布的数值型变量资料。其计算方法有:其计算方法有:直接法直接法:i(I=1,2,n)为第为第i个观察对象的观察值个观察对象的观察值 加权法加权法:i 为第为第i组的组中值组的组中值,fi 为第为第i组的例数组的例数:1111表表9-2
13、分组资料加权法计算平均值及标准差用表分组资料加权法计算平均值及标准差用表尿酸浓度尿酸浓度(mol/L)组组组组中值中值中值中值(x xi i)频数频数频数频数(f fi i)f fi ix xi if fi ixxi i2 2270270277.5277.52 2555.0555.0154012.5154012.5285285292.5292.59 92632.52632.5770006.3770006.3300300307.5307.511113382.53382.51040119.01040119.0315315322.5322.522227095.07095.02288138.02288
14、138.0330330337.5337.524248100.08100.02733750.02733750.0345345352.5352.527279517.59517.53354919.03354919.0360360367.5367.520207350.07350.02701125.02701125.0375375382.5382.515155737.55737.52194594.02194594.0390390397.5397.511114372.54372.51738069.01738069.0405405412.5412.58 83300.03300.01361250.013612
15、50.0420435420435427.5427.51 1427.5427.5182756.3182756.3合计合计15015052470.052470.018518738.018518738.01212(二二)几何均几何均值值(geometric mean,G)适用条件适用条件:等比级数资料等比级数资料.原始观察值呈偏态分布、但原始观察值呈偏态分布、但数据经过对数变换后呈正态分布或近似正态分布的资料。数据经过对数变换后呈正态分布或近似正态分布的资料。如医学实践中某些疾病的潜伏期、抗体滴度、平均效价等。如医学实践中某些疾病的潜伏期、抗体滴度、平均效价等。其计算方法有:其计算方法有:直接法直接
16、法:i 为第为第i个观察对象的观察值个观察对象的观察值加权法加权法:i 为第为第i组的组中值组的组中值(或观察值或观察值),fi 为第为第i组例数组例数:1313抗体滴度抗体滴度(i)人数人数fi滴度倒数滴度倒数Xilg10(Xi)filg10(Xi)(1)(2)(3)(4)(5)=(2)(4)1:2.532.50.39791.19371:5.075.00.69904.89301:10.01410.01.000014.00001:20.0620.01.30107.80621:40.0440.01.60216.4084合合计3434.3013表表9-4 某地某地34名儿童接种麻疹疫苗后血清血凝抑
17、制抗体滴度名儿童接种麻疹疫苗后血清血凝抑制抗体滴度血清血凝抑制抗体的几何平均滴度为血清血凝抑制抗体的几何平均滴度为1:10.206。X=(2.53+5.0 7+10.014+20.0 6+40.0 4)/34=13.6 (算术平均滴度为算术平均滴度为1:13.6)1414(三三)中位数中位数(median,M):将观察值按大小排序后,位次居中的观察值。将观察值按大小排序后,位次居中的观察值。M=X(P=50%)在全部观察值中小于在全部观察值中小于M的观察值个数与大于的观察值个数与大于M的观察值个的观察值个数相等。由于数相等。由于M不受个别特小或特大观察值的影响,适用不受个别特小或特大观察值的影
18、响,适用于分布不规则或分散度很高的资料于分布不规则或分散度很高的资料.3个观察值个观察值:1,3,5.M=3;4个观察值个观察值:1,3,5,7.M=4.直接法直接法:设设n 为观察值的个数为观察值的个数,有公式有公式(9-5)及及(9-6)频数表法频数表法:i 为第为第i组的组中值组的组中值(或观察值或观察值),fi 为第为第i组例组例数数:L:中位数组段下限值中位数组段下限值,fL:小于小于L的的累计频数累计频数,i:中位数组距中位数组距.1515尿铅值尿铅值(mmol/L)人数人数f累累计频数数f累累计频率率(%)(1)(2)(3)(4)=(3)n027278.7725548126.30
19、509517657.14755523175.001003927087.661252129194.481501230398.381755308100.00 合计合计308表表9-5 308名名6岁以下儿童尿铅值的频数分布岁以下儿童尿铅值的频数分布(中位数计算中位数计算)L:中位数组段下限值中位数组段下限值,fL:小于小于L的累计频数的累计频数,i:中位数组距中位数组距,f50%:中位数组频数中位数组频数.L=50,fL=81,i=25f50%=951616三、计算标准差三、计算标准差-反映资料的离散程度。反映资料的离散程度。数值变量数据的频数分布有集中趋势和离散程度两个主要数值变量数据的频数分布
20、有集中趋势和离散程度两个主要特征,只有两者相结合,才能全面地认识事物。特征,只有两者相结合,才能全面地认识事物。反映资料的离散程度的统计量反映资料的离散程度的统计量(统计指标统计指标)有:有:(一一)全距全距(range)或极差:或极差:R=Xmax Xmin全距是一组观察值中最大值与最小值之差。全距是一组观察值中最大值与最小值之差。(二二)四分位数间距四分位数间距(quartile interval):Q=X75%X25%,Q包括了全部观察值中间的一半包括了全部观察值中间的一半.(三三)方差方差(variance)和标准差和标准差(standard deviation)1717例有例有3组同
21、龄男孩的体重组同龄男孩的体重()测量值如下,其平均体重测量值如下,其平均体重都是都是30(),试分析其离散程度。试分析其离散程度。分分组观察察值()全距全距全距全距 R R QQS甲甲组262830323430843.16乙乙组2427303336301264.74丙丙组262930313430822.92丙丙丙丙组*乙乙乙乙组*甲甲甲甲组*体重体重232324242525262627272828292930303131323233333434353536363737()1818标准差的简化计算方法:标准差的简化计算方法:数学上可证明:数学上可证明:故标准差的计算公式又可写成:故标准差的计算公
22、式又可写成:直接法:直接法:X为观察值为观察值 加权法:加权法:Xi为组中值为组中值 表表9-3 尿酸浓度尿酸浓度(mol/L)分组资料加权法计算平均数及标准差用分组资料加权法计算平均数及标准差用表表n=n=f fi i=150=150(f fi i x xi i)=)=52470.0 52470.0(f fi ixxi i2 2)=18518738.0)=18518738.01919标准差的应用:标准差的应用:(1)表示观察值的变异程度表示观察值的变异程度(离散程度离散程度):在两组在两组(或几组或几组)资资料均数相近、度量单位相同的条件下,标准差大,表示观料均数相近、度量单位相同的条件下,
23、标准差大,表示观察值的变异度大,即各观察值离均数较远,均数的代表性察值的变异度大,即各观察值离均数较远,均数的代表性较差。较差。(2)(2)结合均数描述正态分布的特征和估计医学参考值范围。结合均数描述正态分布的特征和估计医学参考值范围。结合均数描述正态分布的特征和估计医学参考值范围。结合均数描述正态分布的特征和估计医学参考值范围。(3)(3)结合样本含量结合样本含量结合样本含量结合样本含量n n计算标准误。计算标准误。计算标准误。计算标准误。2020四分位数间距的计算四分位数间距的计算(interquartilerange,Q):中位数计算公式:中位数计算公式:25%位数计算公式:位数计算公式
24、75%位数计算公式位数计算公式尿铅值尿铅值(mmol/L)人数人数f累累计频数数f累累计频率率(%)(1)(2)(3)(4)=(3)n027278.7725548126.30509517657.14755523175.001003927087.661252129194.481501230398.381755308100.00 合计合计3082121四分位数间距(四分位数间距(interquartilerange,Q)计算公式:Q=X75%X25%X0%X25%X50%X75%X100%|Q|048.1569.21100.0175X1Xn2222描述性统计量归纳描述性统计量归纳反映资料的集中反
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 医学 统计学 PPT 课件
