我想在ggplot中为两组中的每一组绘制Kaplan-Meier生存估计值。
要做到这一点,需要为每个组获得单独的生存曲线。 survfit
包中的survival
函数可以很好地分割,但我不知道如何索引单独的图来处理它们。
以下是示例数据:
rearrest<-read.table("http://stats.idre.ucla.edu/stat/examples/alda/rearrest.csv", sep=",", header=T)
这是未分组的曲线
(sCurve <- summary(arr1 <- survfit(Surv(months, abs(censor-1))~1, data = rearrest)))
很容易在其中索引元素,例如
sCurve$n.event
当我适合同样的事情,除了根据personal
变量的值分组时,我得到了两个很好的生存曲线对象。
(sCurveA <- summary(arr1 <- survfit(Surv(months, abs(censor-1))~personal, data = rearrest)))
一个对象标记为personal=0
,另一个对象标记personal=1
。我尝试使用$
,[]
,[[]]
使用数字类型索引和命名 - 进行索引,但都无济于事。
有人可以帮忙吗?
答案 0 :(得分:2)
sCurveA $ strata将分组变量作为向量提供。您可以拉出关键部分并将它们放入ggplot的data.frame中。
df = data.frame(Time = sCurveA$time,
Survival = sCurveA$surv,
Strata = sCurveA$strata)
ggplot(df, aes(Time, Survival, col = Strata)) +
geom_line()