我的博文

生存分析的Cox回归模型(比例风险模型)

2015-04-22 22:02  阅读(388)  评论(0)  分类:专业

最近有同学问师兄,“最近我要做生存分析,可是我不太会,也不太懂,师兄能不能教教我”,好吧,今天开一贴,讲讲这个。有同样的问题的同学可以一起来看看,毕竟在临床、科研上,这方面知识还是很受用的。有什么想跟师兄讨论的,可以加师兄微信号:shixiongcoming,加我时,注意注明申请理由,如果申请理由是你的名字话,那你就会被师兄忽略掉。就这样吧。让我们开始征程。

一、生存分析基本概念

1、事件(Event)


指研究中规定的生存研究的终点,在研究开始之前就已经制定好。根据研究性质的不同,事件可以是患者的死亡、疾病的复发、仪器的故障,也可以是下岗工人的再就业等等。

2、生存时间(Survival time)

指从某一起点到事件发生所经过的时间。生存是一个广义的概念,不仅仅指医学中的存活,也可以是机器出故障前的正常运行时间,或者下岗工人再就业前的待业时间等等。有的时候甚至不是通用意义上的时间,比如汽车在出故障前的行驶里程,也可以作为生存时间来考虑。

3、删失(Sensoring)

指由于所关心的事件没有被观测到或者无法观测到,以至于生存时间无法记录的情况。常由两种情况导致:(1)失访;(2)在研究终止时,所关心的事件还未发生。

4、生存函数(Survival distribution function)又叫累积生存率,表达式为S(t)=P(T>t),其中T为生存时间,该函数的意义是生存时间大于时间点t的概率。t=0时S(t)=1,随着t的增加S(t)递减(严格的说是不增),1-S(t)为累积分布函数,表示生存时间T不超过t的概率。

二、生存分析的方法

1、生存分析的主要目的是估计生存函数,常用的方法有Kaplan-Meier法和寿命表法。对于分组数据,在不考虑其他混杂因素的情况下,可以用这两种方法对生存函数进行组间比较。

2、如果考虑其他影响生存时间分布的因素,可以使用Cox回归模型(也叫比例风险模型),利用数学模型拟合生存分布与影响因子之间的关系,评价影响因子对生存函数分布的影响程度。这里的前提是影响因素的作用不随时间改变,如果不满足这个条件,则应使用含有时间依存协变量的Cox回归模型。

下面用一个例子来说明SPSS中Cox回归模型的操作方法。

例题

要研究胰腺癌术中放疗对患者生存时间的影响,收集了下面所示的数据:

生存分析的Cox回归模型(比例风险模型)

操作步骤:

SPSS变量视图

生存分析的Cox回归模型(比例风险模型)

菜单选择:

生存分析的Cox回归模型(比例风险模型)

点击进入Cox主对话框,如下,将time选入“时间”框,将代表删失的censor变量选入“状态”框,其余分析变量选入“协变量”框。其余默认就行。

生存分析的Cox回归模型(比例风险模型)

点击“状态”框下方的“定义事件”,将事件发生的标志设为值0,即0代表事件发生。

生存分析的Cox回归模型(比例风险模型)

在主对话框中点击“分类”按钮,进入如下的对话框,将所有分类变量选入右边框中。

生存分析的Cox回归模型(比例风险模型)

在主对话框中点击“绘图”按钮,进入如下的对话框,选择绘图的类型,这里只选择“生存函数”。由于我们关心的主要变量是trt(是否放疗),所以将trt选入“单线”框中,绘制生存曲线。

生存分析的Cox回归模型(比例风险模型)

在主对话框中点击“选项”按钮,进入如下的对话框,设置如下,输出RR的95%置信区间。回到主界面,点击“确定”输出结果。

生存分析的Cox回归模型(比例风险模型)

结果输出

生存分析的Cox回归模型(比例风险模型)

这是案例处理摘要,有一个删失数据。

生存分析的Cox回归模型(比例风险模型)

这是分类变量的编码方式。
生存分析的Cox回归模型(比例风险模型)

这是对拟合模型的检验,原假设是“所有影响因素的偏回归系数均为0”,这里可以看出P=0.032<0.05拒绝原假设,认为有偏回归系数不为零的因素,值得进一步分析。

生存分析的Cox回归模型(比例风险模型)

这是多元回归结果,第二列B为偏回归系数,最后三列为OR值及其置信区间。由P值可以看出,在0.5的显著水平下,只有 trt有统计学差异,OR为2.265。

生存分析的Cox回归模型(比例风险模型)

这是协变量的平均值。

生存分析的Cox回归模型(比例风险模型)

这是总体的生存函数,即累积生存率函数。

生存分析的Cox回归模型(比例风险模型)

这是在控制了其他变量后,有无放疗组的生存函数对比,可以看出,术中放疗患者的生存情况优于不放疗的患者。

 

我要评论

0条评论