分析一生存分析数据所想到的.ppt
《分析一生存分析数据所想到的.ppt》由会员分享,可在线阅读,更多相关《分析一生存分析数据所想到的.ppt(60页珍藏版)》请在三一文库上搜索。
1、分析一个存分析数据所想到的 出现的问题往往多于结论,吴喜之 阎洁 中国人民大学 统计学院 2004年12月,从教科书可期待什么?,整齐的数据(可能有些缺失值) 选好的意义明确的变量 完全确定的研究目标 按照一定的模型进行拟合 得到可合理解释的结果和漂亮的输出 根据理论(条件当然满足)做出解释 一切都令人满意,但是在实际中,数据形式和想象的差别可能很大 可能很难摸清大量变量的内在含义和关系 研究目标经常无法事先确定 没有任何现成的理论来确定什么模型合适 得到各种从统计或医学均不易解释的输出 永远不知数据是否满足一些定理和方法的条件 还需面对许多医学和统计的决策 这些决策很难说哪个“对”或“错”,
2、我们的数据,一个鼻咽癌数据* 只有136个观测值 其中仅有129个可用 一共41个变量,其中包括,性别;病人诊断资料,如原发症状、原发部位、病理分级、B症状有无、国际预兆指数、国际预兆指数合并B症状、淋巴结大小、肿瘤M分期、WHO得分、分化程度、肿瘤T分期、淋巴结单双侧、肿瘤TNM分期等指标;病人治疗资料,如治疗方案、化疗方案、化疗周期;病人治疗近期效果资料,放疗疗效、化疗疗效、总初次治疗疗效;病人远期疗效资料,复发资料-是否复发、复发时间、复发部位、复发肿瘤的TNM分期,合并症资料-是否发生合并症、合并症发生时间,生存资料-是否死亡(指因癌症死亡)、生存时间。,我们面对的第一个决策问题,我们
3、所关心的是复发还是死亡 没有任何理论上的理由来排斥哪一个 它们都和医疗效果相关,但是 从实践的角度,复发数据显然比死亡完整 因此我们仅以复发事件作为考虑重点 这里我们只考虑和此目的有关的22个变量(其中20个为“自变量”),常规的分析方法,进行“复发时间”的常规生存分析 这些方法包括: 简单寿命表 Kaplan-Meier分析 Cox比例风险模型 等等,生命表,Kaplan-Meier方法,为了检验复发时间与哪些因素有关 通常采用了以下三种检验方法: Log Rank检验 Breslow检验 Tarone-Ware检验 三者的区别在于其检验统计量对不同时间的事件赋予的权重不同。,Kaplan-
4、Meier方法,根据三种检验结果可知 有显著影响意义的因素包括: T分期、放疗疗效、化疗疗效、总初次治疗疗效 可能有意义的因素包括: 性别、原发症状、ipi和b症、有无转移、化疗周期数等 于是可以估计生存函数(画图),一些变量的三种检验结果,一些累积生存函数估计图,有些可以区别明显 有些不明显 有些看不出来,生存函数图(性别区分),生存函数图 (关于T分期),生存函数图 (关于初次疗效),生存函数图 (ipi和b症),生存函数图 (放疗疗效?),EN:巩固治疗,CR:完全治愈,PR:部分治愈, S:轻微缓解(或者是没变化) PD:肿瘤进展,生存函数图 (化疗疗效?),EN:巩固治疗,CR:完全
5、治愈,PR:部分治愈, S:轻微缓解(或者是没变化) PD:肿瘤进展,Cox Regression,自变量:20个变量 逐步回归:Forward:LR Ordinal变量处理:当作分类变量。,Cox Regression,注: M分期为”有无转移” T分期为“肿瘤组织学分期”,选中了M分期和T分期,Cox Regression,生存函数图(TM分期),对这些结果的解释企图:,确诊时的T分期和M分期对于肿瘤的复发有显著影响。 确诊时其T分期较早的话,则治疗后复发的可能性要小于T分期较晚的人群,即使复发,其复发时间也相对要晚一些。 M分期也是一样。 因此,能在癌症早期及时发现是鼻咽癌诊治的一个重点
6、。,三种检验不一致时的解释 :,控制“有无B症状”因素,分析放疗效果与复发的关系 其复发时间分布的Log Rank检验结果并不显著,p-值=0.0744,而另外两个检验的结果是显著的,Breslow检验, p-值=0.0280,Tarone-Ware检验, p-值=0.0403,三种检验不一致时的解释 :,多数文献只进行Log Rank检验,而很少用后两种 这三种检验有什么区别呢? 看看这些检验背后的机理 这三个检验的零假设都是检验各组间生存分布相同 三个检验的统计量均是基于比较每个时点的实际发生事件数与期望发生事件数,三种检验不一致时的解释 :,这三个检验的主要区别在于对不同时间点的权重不同
7、: Log Rank检验对每个事件的权重相同,无论其发生早晚 Breslow检验按照在风险中的个体数对事件加权,而在风险中的个体时间而减少,因此早期发生的事件权重晚期发生的事件权重大 Tarone Ware检验按照在风险中的个体数的平方根对事件加权,因此结果则介于前面二者之间,对早期事件的权重要小于Breslow检验,大于Log Rank检验,因而其统计量和p-值也介于二者之间,三种检验不一致时的解释 :,面对以上的分析数据,可以认为:放疗效果对于复发来讲,是有显著影响的 但是其影响更多的是对早期复发,而对晚期复发的影响可能要小一些,定序变量看作分类变量或者定量变量?,一些方便(傻瓜)软件默认
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 分析 生存 数据 想到
链接地址:https://www.31doc.com/p-2114395.html