索引单独的生存曲线

时间:2017-11-30 23:10:07

标签: r survival-analysis

我想在ggplot中为两组中的每一组绘制Kaplan-Meier生存估计值。

要做到这一点,需要为每个组获得单独的生存曲线。 survfit包中的survival函数可以很好地分割,但我不知道如何索引单独的图来处理它们。

以下是示例数据:

rearrest<-read.table("http://stats.idre.ucla.edu/stat/examples/alda/rearrest.csv", sep=",", header=T)

这是未分组的曲线

(sCurve <- summary(arr1 <- survfit(Surv(months, abs(censor-1))~1, data = rearrest)))

很容易在其中索引元素,例如

sCurve$n.event

当我适合同样的事情,除了根据personal变量的值分组时,我得到了两个很好的生存曲线对象。

(sCurveA <- summary(arr1 <- survfit(Surv(months, abs(censor-1))~personal, data = rearrest)))

一个对象标记为personal=0,另一个对象标记personal=1。我尝试使用$[][[]]使用数字类型索引和命名 - 进行索引,但都无济于事。

有人可以帮忙吗?

1 个答案:

答案 0 :(得分:2)

sCurveA $ strata将分组变量作为向量提供。您可以拉出关键部分并将它们放入ggplot的data.frame中。

df = data.frame(Time = sCurveA$time,
                Survival = sCurveA$surv,
                Strata = sCurveA$strata)

ggplot(df, aes(Time, Survival, col = Strata)) +
  geom_line()