《循证医学证据评价的基本原则与方法研.ppt》由会员分享,可在线阅读,更多相关《循证医学证据评价的基本原则与方法研.ppt(41页珍藏版)》请在三一文库上搜索。
1、循证医学- 证据评价的基本原则与方法 南昌大学公共卫生学院 黄 鹏 证据评价的意义与基本要素 n证据评价的意义 证据不一定都是真实的 证据不一定都是重要的 证据不一定都是适用的 医生 政府 公众 患者 专家 证据 n证据评价的基本要素 内部真实性 -结果能否/或者在多大程度上反映真实情况? 影响因素: (1)研究设计:直接决定结果的内部真实性 (2)研究对象:选择偏倚;混杂偏倚 (3)研究环境:信息偏倚 (4)数据分析:统计方法 个别 一般 临床重要性 -结果是否具有临床的实际应用价值? 新药 VS 传统药物 能力的差异的确值得应用吗? 新诊断方法 VS 传统诊断方法 外部真实性(适用性) -
2、结果外推到其他人群的能力 一般 个别 内部真实性和外部真实性 是什么关系? 证据评价的基本内容和方法 n证据评价的基本内容 研究目的:是否明确、重要、科学、先进、可行? 研究设计:是否科学、可行? 研究对象:定义是否明确?代表性如何?有无入选和排除标准? 观察测量:变量的定义是否明确?指标选择是否合理?测量是否 可靠? 结果分析:统计方法是否恰当?偏倚的处理是否考虑? 质量控制:针对可能的偏倚采取了那些预防措施? 结果表达:效果如何?不良反应多大?不足之处? 卫生经济:是否进行成本-效果,效益,效用分析? 研究结论:是否回答了假说?结论是否可以外推?与他人的结果 是否一致? n证据评价的基本方
3、法 初筛临床研究证据的真实性和相关性 确定研究证据的类型 证据评价的注意事项 真实性 1、这篇文章是否来自经同行评审(peer-reviewed)的杂志 ? 有同行评审的杂志上发表的文章均经过了严格的评审过程, 尽可能筛除有严重缺陷的文章,提高了发表文章的质量。 2、这篇文章的研究场所是否与你的医院相似,以便结果真实时可 应用于你的患者? 这个问题可以通过阅读作者的单位或进行研究的场所确定。如果 你在乡村医院工作,阅读的文章是在某个大学的专科病房所进行的研 究,你就要考虑其结果应用到你的病人时可能存在环境条件以及患者 本身的差异,当然这不是拒绝这篇文章的重要理由,但如果差异太大 ,应谨慎考虑。
4、 3、该研究是否由某个组织所倡议,导致其研究设计或结果 可能受到影响? 这个问题主要考虑研究资金的来源可能导致的偏倚。 大多数杂志要求研究人员说明研究资金的来源。 如果一个研究有药厂或其它商业组织资助,应要求研究 人员保证其研究的设计和结果并未因此而受到影响。 下面的三个问题涉及临床相关性,可通过阅读摘要的结论和相 关部分获得。 临床相关性对医生和病人均很重要。 一般来说,如果一篇文章 涉及的问题临床很少见,或涉及的治疗或诊断方法在你的医院根本 没有开展,这样的文章不值得阅读。即使阅读也只是满足了你的学 术好奇心,不会影响你的临床实践。因此,以病人为中心的临床研 究证据远比以疾病为中心的研究证
5、据实用。 如一篇文章描述了某种方法用于筛选某种癌症的敏感度和特异 度(以疾病为中心的证据),而另一篇文章描述经过这种筛选试验 可以提高患者的生存质量或寿命(以病人为中心的证据),你应该 首先阅读后一篇文章。 相关性 4、如果研究证据提供的信息是真实的,是否为你的患者所 关心的问题?对患者的健康有无直接的影响? 可以通过阅读文章摘要的结论部分初步解决这个问题。例 如,如果某篇文章的结论为通过某种治疗方法,脑卒中患者 偏瘫肢体的肌电图有明显改善,并未涉及肌力和活动能力; 但对于患者、医生来说,可能更关心的是经过治疗后偏瘫肢 体的肌力是否改善、能否活动,因此该研究提供的信息并不 是你的患者所关心的问
6、题。 相关性 5、是否为临床实践中常见问题,涉及的干预措施或试验 方法在你的医院是否可行? 如果文章涉及的问题在临床实践中经常遇到,且研究的 干预措施或试验方法在你的医院也有条件实行,这样的文章 值得深入阅读。 6、如果研究证据提供的信息是真实的,是否会改变现有 的医疗实践? 如果文章涉及的干预措施或试验方法,你过去未在类似 的病人中使用过,也许新的尝试可能获得意外的收获,因此 ,有必要继续阅读这篇文章。 以上6条着重于“带着病人的临床问题” 去阅读证据 n证据评价的基本方法 初筛临床研究证据的真实性和相关性 确定研究证据的类型 根据研究证据类型进行评价 确定研究证据的类型 要明确该研究的目的
7、和要解决的临床问题是什么? 这可通过阅读文章的摘要,必要时文章正文的前言以确定 研究的目的。 一般来说,原始研究回答的主要临床问题有四类:病 因、诊断、治疗和预后。 不同的临床问题其研究设计方案是不同的。不同的研 究设计其产生证据级别是不同的。 原始研究涉及的主要临床问题及其常用的设计方案 研究目的设计方案 病因研究队列研究、病例对照研究、试验 性研究、横断面研究 临床疗效研究试验性研究(RCT) 诊断试验评价横断面研究 预后研究队列研究、随访研究 疾病在人群中的分布横断面研究 特殊病例描述和介绍个案报告、病例分析 n证据评价的基本方法 初筛临床研究证据的真实性和相关性 确定研究证据的类型 根
8、据研究证据类型进行评价 *不同的研究设计采用不同的原则进行评价 n证据评价的注意事项 方法学评价是基础:研究设计直接决定证据的级别。 证据的真实性是评价重点:不真实,就无所谓重要和适用。 要选择恰当的评价指标:要做到“门当户对”。 评价力求全面系统:针对研究的全过程进行评价。 评价要实事求是:任何研究都会有缺陷和不足,应合理评估其作用和不足。 正确认识阴性结果:要注意区别真阴性和假阴性。 论文的基本格式(以研究原著为例) 1.文题 2.作者署名 3.研究单位 4.摘要 5.关键词 6.正文:引言;材料与方法;结果;讨论 7.致谢 8.参考文献 文章的研究策略是什么? n该研究策略用于解答作者提
9、出的研究问题是否恰当? n如果不恰当,这个研究所产生的结果有多大的价值? 常用的研究策略包括 n病例系列报告(临床分析) : 报告经验,不解答问题或验证假说 n横断面研究 :确定某个健康问题的强度 n队列研究和病例-对照研究 :因果关系的推断 n随机对照试验 :判断某干预因素(如治疗)的效果 该研究所演绎的总体人群是什么? n样本结构是什么? n样本结构能否准确代表该研究的总体人群? n用什么方法抽样? n是否存在抽样偏倚? n如果有偏倚,它是否危害到研究结果的外部有效性? 研究因素是什么? n研究因素是什么? n如何测量这些研究因素? n这些测量方法是否有误? n如果有误,是否会对结果造成明
10、显的偏倚? 结局因素是什么? n结局因素是什么? n是否所有相关的结局因素均被考虑到? n如何测量这些结局因素? n是否存在测量误差? n被遗漏的结局因素是否重要? n测量的误差是否使结果产生明显的偏倚? 该研究中是否可能存在偏倚? n有无选择偏倚、信息偏倚、混杂偏倚? 在实验性研究,病例如何分组? 在队列研究,有多少完成随访? 在病例-对照研究,对照组是否合适? n是否有什么措施去避免或解决这些偏倚? n这些偏倚是否危害到该研究的内部有效性? 该研究是否考虑到样本量的推算? n研究功效是否被阐明? n样本量是否足以检测有意义的区别 ? 统计学方法是否被阐明? n作者使用什么统计方法? n该方
11、法是否适合研究的问题和资料? n是否提供了可信区间? n如果统计学分析的结果支持无效假说,是否提供了 该研究的功效? 针对研究的问题,作者作出了什么结论? n研究结论的引述是否根据研究分析的结果? n你同意这个结论吗? 举例 n 原文题目:银屑病发病与血型的关系探讨,原作者 对64例银屑病患者进行血型观察,其中O型血30例,A型血 17例,B型血17例,AB型血0例。作者通过计算不同血型所 占的比例,认为银屑病的发病与血型有明显的关系。 根据常识,正常人群中的血型构成存在较大差异,AB型所占的比例 就是最少,作者没有对正常人群的血型分布情况进行调查,仅根据自己 调查的银屑病人血型构成相差悬殊的
12、情况,并不能说明银屑病人与正常 人群在血型构成上存在差异,作出结论也是没有说服力的。 正确的做法应建立正常对照组,调查正常人群的血型分布情况,并 与银屑病人的血型分布情况进行比较,如果存在差异,则为银屑病的发 病因素提供了某种线索,如果没有差异,则可以认为银屑病发病与血型 构成没有关系。 举例 n原文题目:补骨1号对大鼠类固醇性骨质疏松的作用,24 只大鼠随机分成3组,每组8只。一组:正常对照组(用生理盐 水灌胃),二组:激素组(氢化可的松灌胃),三组:补骨1 号合用激素组(氢化可的松灌胃的同时加用补骨1号)。实验 一段时间后,测定骨小梁面积等定量指标,经分析,认为补骨 1号有防治类固醇性骨质
13、疏松的作用。 n分析:此实验涉及两个因素,即“激素用与否”和“补骨1号用与否 ”,如果这两个因素不是互相独立的,存在着交互作用,则第三组的 效应就包括激素的效应,补骨1号的效应,以及它们共同作用的效应 ,本实验只安排了激素组,并没有安排单用补骨1号组,因而在实际 分析时就不能将两因素之间可能存在的交互作用的效应反映出来,而 有可能将其交互作用的效应归结为单用补骨1号的效应。 应再安排一组单用补骨1号组,这样就有四个组,为两个因 素各有两个水平的四种组合,这样的设计类型为两因素析因设计,不 仅可以分析出各因素单独的效应,而且可以分析出因素之间可能存在 的交互作用的效应大小。 举例 n原文题目:肝
14、炎灵联合丹参注射液治疗慢性乙型肝炎60例,慢性 乙型肝炎病人随机分为两组,治疗组60例,接受肝炎灵与丹参注射液 联合治疗,对照组44例,接受肌苷、维生素C的治疗,两组在性别、 年龄、病程、病情等方面均无显著性差异。比较两组肝功能指标恢复 正常率,得出结论:两药联合应用治疗慢性乙型肝炎有良好的协同作 用。 从文中可以看出,原作者的目的是想通过两药合用看是否能增加 单用药的疗效,但对照组却选择了不相干的肌苷和维生素治疗。即使 通过分析治疗组比对照组疗效好,也不能得出两药合用比单用其中一 种药疗效好的结论,因为原作者对对照组的处理与实验设计的目的不 符,并没有用单用肝炎灵作为对照。结论仅是作者的主观
15、臆断,是没 有说服力的。 举例 n原文题目:糖尿病患者血清肌酸激酶变化的意义,随机选择住院 的非胰岛素依赖型糖尿病患者110例,根据临床常规检查分为:(1)血 管病变组(组),(2)无血管病变组(组),(3) 组中血糖控 制良好者(组),(4) 组中血糖控制良好者(组)。测定各组 糖尿病患者血清肌酸激酶等指标,并进行比较,说明血管病变及血糖 控制对指标的影响。 由上面可以看出,组包含在组里面,组包含在组里面, 假如血管病变组中血糖控制良好者较少,而无血管病变组中血糖控制 良好者较多,如果两组比较肌酸激酶有差别,则不一定就是血管病变 的原因,而可能是两组中血糖控制良好者构成不同而引起的,这样得
16、出结论也是不可信的。 举例 n原文题目:酒精对小鼠体质影响的初步研究,目的:探讨酒 精对动物体质的影响。方法:选用雌雄昆明小鼠各30只,体重20 30。雌雄小鼠随机分为3组。分别以纯水、5%酒精、10%酒精 为唯一饮料连续喂养60,然后测算动物的体重增加量。结果: 随着酒精浓度提高,雄性小鼠的体重增加量显著变大(0 05),而 雌性小鼠变小(0 05)。 n分析:根据常识,动物的进食量对体重的增长具有重要作用,如 果不同组小鼠进食量不同,即使分析出各组小鼠体重增加量不同 ,仍不能说明单是酒精的作用。 应在实验设计时,结合专业知识,考虑重要的非实验因素对 实验结果可能带来的影响,以免因考虑不周,
17、到实验结束时无法 弥补而导致整个实验的失败。本资料在实验设计时,应考虑小鼠 进食量不同对体重增加量可能带来的影响,在实验时记录小鼠每 天的进食量,这样可通过协方差分析,消除各组小鼠进食量不同 所造成的影响,从而更清楚地表现不同浓度酒精对小鼠体重增加 量的影响。 n 原文题目:小剂量干扰素加三氮唑核苷治疗流 行性乙型脑炎99例分析,有人在一般治疗的基础上加用 小剂量干扰素及三氮唑核苷治疗流行性乙型脑炎99例,采 用同期的、接受一般治疗的73例该病患者作为对照。治疗 组中轻型29例,普通型40例,重型22例,极重型8例;对 照组73例,轻型18例,普通型32例,重型17例,极重型6 例。两组病人均
18、采用传统降温、镇静、降颅内压、肾上腺 皮质激素及抗生素预防感染等对症治疗。在此基础上治疗 组选择发病在5天以内的病人,加用干扰素和三氮唑核苷 静滴,疗程5-7天。两组比较疗效差别具有显著性意义, 结论是在一般治疗的基础上加用小剂量干扰素及三氮唑核 苷治疗流行性乙型脑炎的疗效优于一般治疗的疗效。 举例 n作者在比较时考虑到了病情的严重程度可能是影响疗效的 一个影响因素,因此在两组中对病情严重程度作了安排, 经卡方检验,两组在病情严重程度的构成上的差别没有显 著性意义,好象具有了可比性。其实不然,作者人为地选 择发病在5天以内的病人进入治疗组,而对照组则没有此 限制,根据常识,早期治疗对疾病的预后
19、具有重要影响, 往往具有较高的治愈率和较低的病死率。因而治疗组和对 照组由于人为因素的干扰和影响,在病程这一重要的非实 验因素上并没有达到均衡,不具有可比性。 举例 n分析:根据病理常识,硬结预后与年龄、病程及硬结本身的大小都有很 大关系(年龄小、病程短、硬结小,预后相对好)。从资料可以看出, 研究对象年龄跨度大(从18个月到68岁),病程差距大(从1周到15年 ),并且硬结的大小也存在较大的差距(1cm1cm5cm7cm)。 原作者对采取何种方法使重要的非实验因素在各组间达到均衡未作任何 说明,只是一味地将三组拿来直接进行比较,如果均衡性原则掌握得不 好,则有可能结论的可靠性不高甚至得出错误
20、的结论。 在进行试验之前,最好进行完善的试验设计,明确所要考察的实验 因素,受试对象,所观察的指标,以及对试验结果可能产生影响的重要 的非实验因素,务必使各重要的非实验因素在各组间尽量达到均衡一致 ,这样得出的结论才具有较强的可信性和说服力。 举例 此资料中原因变量(组别)是名义变量,结果变量(疗效)是有序 变量,因而属结果变量为有序变量的单向有序列联表资料。因一般2 检验与变量的有序性没有联系,用一般2检验进行分析,得到的结论 是两组疗效的频数分布是否相同,而不能得出两组疗效的差别是否具有 显著性意义的结论。 举例 n原文题目:学习困难儿童视觉-运动整合发育测验分析,目的: 探讨学习困难(L
21、D)儿童视觉-运动整合(VMI)发育状况,以及VMI与韦氏 总智商、3因子智商相关关系。方法:采用BeeryVMI发育测验及中国 韦氏儿童智力量表,对60名年龄在712岁LD儿童进行个体测试。结果 :LD儿童均有VMI能力发育落后,比实际年龄落后15%45%;与数学成 绩的相关系数为0.305(P0.05)。VMI测验结果与韦氏智力总智商、3 因子智商相关性分析,与B因子相关性较高,相关系数为0.384(P0.01) 。结论:LD儿童视觉-运动发育明显落后,在智力正常但有学习困难的 儿童中进行VMI测试可以判断儿童有关学习能力缺陷的有无和程度。 对儿童学习能力的预测和早期干预有较高的价值。 尽
22、管对相关系数作假设检验后认为相关系数有统计意义,但并不 意味着这种相关关系就一定具有实际意义,要结合确定系数作出解释 ,确定系数是相关系数的平方r2,其意义是:因变量的变异(离均差平 方和)中有多大比例是与自变量变化有关的。本例中VMI测验结果与数 学成绩的相关系数的大小为0.305,其确定系数为0.093,说明VMI测验 结果的变化中大约有9%与数学成绩有关,或者说还有约91%与数学成绩 无关,可见这种关系并不密切。 举例 n原文题目:中老年人脂肪肝与并存病关系,对435例45岁以上受检人员进 行B超检查,检出脂肪肝患者102例,非脂肪肝人员333例,原作者据此将受检 人员分为两组,即脂肪肝
23、组和非脂肪肝组,同时还对受检人员检测了空腹12h 血糖、总胆固醇、甘油三酯、血尿酸。并对两组人员的血糖、总胆固醇、甘 油三酯和血尿酸进行比较,采用t检验,脂肪肝组与非脂肪肝组的血脂、血糖 和血尿酸水平比较有非常显著性差异(P0.01),表明血脂、血糖和血尿酸 的增高程度对脂肪肝的形成产生一定的影响,尤其是甘油三酯的水平起重要 作用。 对于观察性研究来说,由于没有或不能对观察对象进行随机分组,单纯假 设检验不能解决混杂和偏倚的问题,也不能说明事件的先后顺序,因此不能直 接推论因果关系,只能推论关联。本资料中的脂肪肝组和非脂肪肝组,假如存 在某些混杂因素,如两组的年龄或生活习惯等不均衡,则在推论时很难说清是 混杂因素的存在还是确实是脂肪肝的原因而造成血液指标的不同。另外,根据 专业知识,脂肪肝形成后,其血液指标一般也要发生变化,本研究并不能说明 血液指标是在脂肪肝形成前发生变化还是脂肪肝形成后发生的变化,而推论因 果关系则要求原因在前,结果在后,从这点上来说,也不能主观地推论血脂、 血糖和血尿酸的增高对脂肪肝的形成产生一定的影响。
链接地址:https://www.31doc.com/p-3492036.html