我正在尝试在coxph
包下使用survival
函数。通常它将被称为:
coxph(Surv(time,event) ~ age+gender+salary, data=THEDATA)
。
但是,我在THEDATA
中有多个列。我怎么能轻易打电话给他们?例如,我想基于第8-12列的变量构建Cox模型。与做
coxph(Surv(THEDATA$time,THEDATA$event)~ THEDATA[,8] + THEDATA[,9] + THEDATA[,10] + THEDATA[,11] + THEDATA[,12])
,如何使用更高效的代码来完成这项工作?
答案 0 :(得分:2)
这就是变量名称应尽可能短的原因。
library(survMisc)
### reproducible data
set.seed(1)
### 12 variables (no factors for simplicity)
df1 <- genSurvDf(f=0, c=10)$df
c2 <- colnames(df1)[1:12]
### loop through each variable
for (i in 1:length(c2)){
print(c2[i])
print(coxph(Surv(t1, e) ~ get(c2[i]), data=df1))
}
这改编自?formula
:
f1 <- as.formula(paste("Surv(t1, e) ~ ",
paste(c2, collapse= "+")))
coxph(f1, data=df1)
您应该能够修改上述内容以满足您的需求,例如
f1 <- as.formula(paste("Surv(t1, e) ~ ",
paste(c2[8:12], collapse= "+")))
如果你想做所有组合(最多一定数量),这对小型数据集很实用,这可能更有效:
c1 <- coxph(Surv(t1, e) ~ ., data=df1)
### check all combinations of up to 3
### sort by information criteria
multi(c1, maxCoef=3, how="all", confSetSize=Inf)