2016级安徽医科大学医学统计学重点概述.doc
《2016级安徽医科大学医学统计学重点概述.doc》由会员分享,可在线阅读,更多相关《2016级安徽医科大学医学统计学重点概述.doc(25页珍藏版)》请在三一文库上搜索。
1、一、 名词解释1. 总体population:就是根据研究目确实定的同质观察单位的全体,确切的说,是同质的所有观察单位*种变量值的集合2. 样本sample:就是从总体中随机抽取局部观察单位,其实测值的集合3. 同质homogeneity:性质一样的事物称为同质,否则称为异质4. 系统误差:是指数据搜集和测量过程中由于仪器不准确、标准不规等人为原因,造成观察结果偏大或偏小的一种误差,是由确定原因造成的误差。5. 随机误差:是由一些非人为的偶然因素,使得结果或大或小,是不确定、不可预知的一种误差,分为随机测量误差和抽样误差6. 抽样误差sampling error:由于随机抽样所引起的样本统计量
2、与总体参数之间的差异以及样本统计量之间的差异称为抽样误差7. 定量资料:是通过度量衡的方法,测定每一单个观察单位*项研究指标的量的大小得到的资料,也称计量变量或数值变量。8. 定性资料:是将全体观察单位按*种性质或特征分组,然后再分别清点各组观察单位的个数所得到的资料,称定性资料也称计数变量或分类变量。9. 等级资料:是将观察单位按属性的等级分组,清点各组的观察单位数,所得的资料为等级资料,又称有序分类资料。10. 变异系数:又称变异程度,简称变异度,记为CV,是相对数,用于比拟单位不同或均数相差较大的多组资料的变异程度。公式为CV=s/*100%11. 小概率事件原理:假设在一次观察或试验中
3、发生的可能性很小或几乎不可能发生,可以看做很可能不发生,则称该事件为小概率事件。12. 率rate:是*现象实际发生的观察单位数与可能发生该现象的观察单位总数之比,用以说明*现象发生的频率或强度13. 构成比:说明*一事物部各组成局部所占的比重或分布,等于*一组成局部的观察单位数/同一事物各组成局部的观察单位总数100%14. 医学参考值围reference range:指医学领域中特定的“正常人群即排除了对所研究指标有影响的疾病和相关因素的特定人群的解剖、生理、生化指标及组织代产物含量等数据的大多数个体一般为95%的取值围15. 置信区间:是对这个样本的*个总体参数的区间估计,置信区间展现的
4、是这个参数的真实值有一定概率落在测量结果的周围的程度,给出的是被测量参数的测量值的可信程度16. 均数为95%的CI值置信区间:按一定的概率或可信度1-a用一个区间来估计总体参数所在的围,这个围称作可信度为1-a的可信区间CI又称置信区间,95%的可信区间中的95%是可信度,即,所求的可信区间包含总体参数的可信程度为95%17. 标准误standard error:是反映均数抽样误差大小及样本统计量之间离散程度的指标18. 检验水准size of test:亦称显著性水准,用表示,它是预先确定的概率值,即小概率事件的标准,一般情况下取0.0519. P值:指H0成立,从所规定的总体中随机抽样,
5、所获得等于及大于或等于及小于现有样本计算获得的检验统计量值的概率20. 类错误typeerror:如果实际情况与H0一致,仅仅因为抽样的原因,使得假设检验的结论为拒绝原本正确的H0,导致推断结论错误,这样的错误称为类错误。犯类错误的概率用来控制假阳性 / 弃真错误21. 第类错误typeerror:如果实际情况与H0不一致,仅仅因为抽样的原因,使得假设检验的结论为不拒绝原本错误的H0,导致推断结论错误,这样的错误称为类错误。犯类错误的概率用来控制假阴性 / 取尾错误22. 检验效能power of a test:为1-,即当两总体确实有差异H0不成立,按照事先确定的检验水准,假设检验能发现该差
6、异拒绝H0的能力,1-也取单尾23. 配对设计:配对设计是将受试对象按配对条件配成对子,每对中的个体承受不同的处理,配对设计一般以主要的非实验因素作为配比条件,而不以实验因素作为配比条件24. 完全随机设计:又称成组设计,只有单个研究因素,该因素有多个水平,如在实验中安随机化原则将受试对象随机分配到一个研究因素的多个水平中去,然后观察实验效能25. 随机区组设计:又称配伍设计,属于两因素方差分析,用于多个样本均属的比拟26. 析因设计:当两个因素或多个因素之间存在相互影响或交互作用时,可用该设计来进展分析。该设计不仅可以分析多个因素的独立作用,也可以分析多个因素间的交互作用,是一种高效率的方差
7、分析方法27. 卡方检验的根本思想:通过计算实际频数与理论频数的吻合程度来判断所给的处理因素是否有效28. 卡方值:实际频数与理论频数的吻合程度,其大小即用卡方值来表示。29. 非参数检验:不依赖于总体分布类型,也不对总体参数进展统计推断的假设检验的方法,称为非参数检验30. 线性相关关系:如果具有相关关系的随机变量组成的散点图在直角坐标系中呈直线趋势,就称这两个变量存在线性相关关系31. 线性相关方关系:如果两个随机变量中,一个变量有小到大变化时,另一个变量也相应的由小变大或由大变小,并且呈直线趋势,就称这两个变量存在直线相关关系教师给的定义32. 相关系数:是说明两变量间线性关系的密切程度
8、和相关方向的一个统计指标,样本的相关系数用r表示,总体的相关系数用表示33. 回归系数:在回归方程中表示自变量*对因变量y影响大小的参数,正回归系数表示y随*增大而增大,负回归系数表示y随*增大而减小 34. 最小二乘法原理:即各实测点到回归直线法的纵向距离的平方和最小,是回归方程可以较好的反映各实测点的分布情况35. 双盲:受试对象和实验者都不知道受试对象分在哪一组36. 调查设计的四种方法: 1单纯随机抽样:保证总体中每一个个体都有同等的时机被抽出来作为样本的抽样方法 2系统抽样:即先将总体的全部个体按与研究现象无关的特定排序编号,依次每隔假设干抽取的一个个体组成样本 3分层抽样:先将总体
9、全部个体按*种特征分成假设干层,再从每层随机抽取一定数量的个体合起来组成样本 4整群抽样:先将总体分成假设干群体,形成一个抽样框,从中随机抽取几个群体组成样本,对抽中群体的全部个体进展调查二、 简答题1. 简述频数表的绘制方法(1) 找出最大值、最小值和极差:极差=最大值最小值(2) 确定组距、组段、组数:频数表一般设8-15个组段,常用极差的1/10取整作组距,第一组段包括最小值,最后一个组段要包括最大值并写出其下限上限(3) 列表划记:把确定的组段序列制成表的形式,得出各组段频数2. 简述应用相对数的考前须知(1) 计算相对数时分母一般不宜过小。只有当观察单位足够多时,计算出的相对数才比拟
10、稳定,且能正确反映实际情况。(2) 分析时注意构成比和率的区别。构成比说明事物部各组成局部所占的比重,即只能说明分布,不能说明*现象发生的频率或强度。(3) 合计率的计算。对观察单位不等的几个率,不能直接相加求其平均率,而应用合计的数据来计算。(4) 比拟相对数时应注意资料的可比性。除了研究因素以外,其他影响因素应尽可能相近或一样比拟才有意义。(5) 对样本率、构成比的比拟应作假设检验,不能凭外表数值大小下结论。3. 确定医学参考值围的原则:(1) 制定“正常人群的入选标准(2) 确定样本量的大小,在符合入选标准的人群中随机抽样(3) 对样本中的每个个体进展指标测量(4) 确定是否要分组制定参
11、考值围(5) 根据该指标* 的背景意义,确定参考值的围是双侧还是单侧(6) 根据样本资料的分布情况确定采用正态分布法还是百多分位数法4. 检验假设的根本步骤:(1) 建立检验假设,确定检验水准(2) 选择检验方法,计算统计量(3) 确定P值,做出推断结论5. 简述假设检验应用的考前须知(1) 假设检验的前提是要有严密的抽样研究设计:应尽量从同质总体中随机抽取,尽量保证组间均衡性,以确保资料具有可比性。(2) 正确选定假设检验方法:资料性质、分布类型、设计类型、样本大小等不同,以及分析的目的不同,适用的假设检验的方法也不同。(3) 正确理解“差异无统计学意义:H0成立可能性是小概率,也就是说两者
12、差异存在的可能性较大,“差异统计学意义也不一定具有临床意义。(4) 结论不能绝对化:是否拒绝H0取决于研究对象有无本质差异和抽样误差大小,以及检验水准的上下,而检验水准与实验设计密切相关。(5) 报告结论时应注意:应列出样本计算的检验统计量值,注明采用的是单侧检验还是双侧检验,写出P值。4. 简述假设检验应注意的问题:(1) 选择检验方法必须符合资料的适用条件(2) 单侧检验和双侧检验的选择(3) 正确理解P值得意义(4) 结论不能绝对化(5) 当假设检验的结果为不拒绝时,应考虑该检验的检验效能,如果检验效能较低,则此时的结论可靠性较差5. 方差分析的根本思想:是根据资料的设计类型和研究目的,
13、将全部观察值总的离散程度和自由度分解为相应的几个局部,除了随机误差外,其余每个局部的变异可由*个因素的作用加以解释,如各组均数间的变异可由处理因素的作用加以解释6.在进展双向无序行列表卡方检验时发生偏性的处理方法:P157(1) 增大样本量,当样本量增大时理论频数会增大(2) 根据专业知识对理论频数较小的行或者列进展合并或者删除(3) 改用双向无序行列表的Fisher确切概率法7.简述秩和检验的优缺点及应用1优点:计算简单便于掌握 缺点:损失信息应用围广 检验效率低收集资料方便(2) 应用:分布型未知能以严重程度、优劣等级、效果大小和名次先后等等级资料分布极度偏态本组个别变量值偏离过大,远离本
14、组其它变量值方差不齐时筛选或只需获得初步结果。8. 秩和检验编秩次的方法:(1) 按差值的绝对值大小编秩次,并根据差值的正负给秩次加上正负号(2) 假设差值为0,则舍去不计,相应的对子数n随之减少(3) 假设差值的绝对值相等,则取平均秩次9. 在进展双向无序行列表卡方检验时发生偏性的处理方法:P157(4) 增大样本量,当样本量增大时理论频数会增大(5) 根据专业知识对理论频数较小的行或者列进展合并或者删除(6) 改用双向无序行列表的Fisher确切概率法10.简述应用线性相关分析的考前须知(1) 绘散点图了解线性趋势,样本的相关系数接近零时并不意味着两变量间一定无相关性(2) 线性相关分析要
15、求两个变量都是随机变量,且仅适用于二元正态分布资料(3) 作相关分析时,应该剔除离群值,出现异常点时慎用相关(4) 相关要有实际意义,两变量相关并不代表两变量间一定存在在联系(5) r=0说明无相关或非线性相关(6) 分层资料盲目合并易出假象教师的更简洁:(1) 进展相关分析前应先绘制散点图,以提示是否有必要进展线性相关分析(2) 样本的相关系数为0时,并不意味着两变量一定无相关性(3) 一个数值随机变动,而另一个变量的数值却是人为选定的,此时不宜做相关分析两变量都应是随机的,均符合正态分布(4) 作相关分析时,应该剔除离群值,出现异常点时慎用相关(5) 相关分析要有实际意义,相关未必真有在联
16、系(6) 分层资料盲目合并易出现假象11. 线性回归分析的适用条件: 线性 独立 正态 方差相等(1) 因变量Y与自变量*呈线性关系 (2) 每个个体观察值之间相互独立(3) 因变量Y属于正态随机变量 (4) 在一定围,不同的*值所对应的随机变量Y的方差相等12.简述应用线性回归的考前须知(1) 进展线性回归分析时,应先绘散点图,提示有直线趋势存在时,可作线性回归分析(2) 进展线性回归分析时,一般要求因变量Y是来自正态总体的随机变量,自变量*可以是正态随机变量,也可以是准确测量和严密控制的值(3) 进展线性回归分析要有实际意义,不能把毫无关联的两个事物或现象进展进展线性回归分析(4) 进展线
17、性回归分析必须进展假设检验,以推断两变量间的线性关系是否存在(5) 回归直线不能外延,以自变量取值围为限13. 简述线性回归与相关的区别及联系(1) 区别:资料要求不同:相关:两变量均为随机变量,并服从双变量正态分布 回归:Y服从正态分布,*为选定变量统计意义不同:相关:只反映两变量间相互依存 回归:有一个变量推算另一个变量 回归关系与原度量衡单位有关,相关关系则无分析目的不同:相关:两变量间线性关系的密切程度及相关方向 回归:用函数公式定量表达因变量随自变量变化的关系(2) 联系:变量间关系的方向一致:对同一资料,其相关系数r与回归系数b 的正负号一致 假设检验等价:实际分析中常以r的假设检
18、验代替对b的检验r与b值可相互换算用回归解释相关:r2称决定系数,r2越接近1,回归效果越好。三、 填空题1. 统计学的研究对象是变异的数据2. 医学统计学工作的根本步骤是:设计、搜集资料、整理资料、分析资料,其中最重要的步骤是科研设计3. SPSS主要有4大窗口:数据编辑窗口Data Editor、结果输出窗口Viewer、程序编辑窗口Synta* Editor、图表编辑窗口Chart Editor4. SPSS能直接调用的数据文件类型常用的有:*.sav、*.*ls、*.dbf、*.t*t、*.dat5. 等比资料的集中趋势常用的描述方法是几何均数G6. 定量资料的集中趋势:均数、几何均数
19、中位数、百分位数7. 定量资料的离散趋势:全距、四分位数间距、方差、标准差、变异系数8. 偏态分布的集中趋势常用的描述方法是中位数;偏态分布的离散趋势常用的描述方法是四分位间距9. 单位不同或均数相差较大的多组资料常用的描述方法是:变异系数CV10. 参数是指:总体的统计指标;统计量是指:样本的统计指标11. 标准正态分布是一种特殊的正态分布,标准正态分布的:=0,2=1 ,通常用u或Z表示服从标准正态分布的变量,记为:uN0,1212. 正态分布函数中代表:总体均数位置参数,代表总体标准差变异度参数13. 正态分布曲线区间面积为95%的围是:-1.96,+1.96 99%的围是:-2.58
20、2.58 90%的围是:-1.64,+1.6414. 正态分布数据的参数估计1.96S;偏态分布数据的参数估计P25,P7515. 二项分布的条件:每次试验只有两种结果死亡或者存活、实验结果之间彼此独立、每次试验结果发生概率固定不变16. 二项分布近似正态分布的条件是:当n足够大时n50,只要不太靠近0或1,尤其是n和n1-均大于517. Poisson分布的条件:每次试验只有两种结果死亡或者存活、实验结果之间彼此独立、每次试验结果发生概率固定不变 + 总体发生概率非常小18. Poisson分布近似正态分布的条件是:2019. Poisson分布的两个特性是:均数与方差相等,观察结果有可
21、加性20. t分布的自由度越小,t分布曲线越低平,尾部越高;自由度越大,t分布 曲线越接近标准正态分布u分布Z分布与自由度无关21. 医学参考值围通常表达为1.96S;置信区间围通常表达为1.96S; 其中围较宽的是医学参考值围22. 假设检验的根本原理是反证法思想和小概率事件23. 配对样本均数的t检验,配对设计主要由以下几种形式:两种同质受试对象分别承受两种不同的处理同一受试对象或者同一样本的两个局部分别承受两种不同的处理同一受试对象承受*种处理前后24. t检验的应用条件有:样本例数n较小、样本均是随机样本、符合正态分布、方差齐两样本25. t检验P0.05拒绝H0有统计学意义;正态性检
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 2016 安徽 医科大学 医学 统计学 重点 概述
