我使用最佳子集选择包来确定用于构建模型的最佳独立变量(我确实有这样做的特定原因,而不是直接使用最佳子集对象)。我想以编程方式提取特征名称,并使用生成的字符串构建模型公式。结果将是这样的:
x <- "x1 + x2 + x3"
y <- "Surv(time, event)"
因为我正在构建coxph
模型,所以公式如下:
coxph(Surv(time, event) ~ x1 + x2 + x3)
使用这些字符串字段,我试图像这样构造公式:
form <- y ~ x
这将创建一个formula
类的对象,但是当我调用coxph
时,它不会基于从公式对象创建的引用进行评估。我收到以下错误:
Error in model.frame.default(formula = y ~ x) : object is not a matrix
如果在eval
调用中对对象y和x调用coxph
,则会得到以下信息:
Error in model.frame.default(formula = eval(y) ~ eval(x), data = df) :
可变长度不同(为'eval(x)'找到)
我不太确定该如何进行。感谢您的输入。
答案 0 :(得分:1)
找不到好听的骗子,所以发表评论作为答案。
如果您将完整的公式构建为字符串,包括~
,则可以在其上使用as.formula
,例如
x = "x1 + x2 + x3"
y = "Surv(time, event)"
form = as.formula(paste(y, "~", x))
coxph(form, data = your_data)
有关可重现的示例,请考虑?coxph
帮助页面底部的第一个示例:
library(survival)
test1 <- list(time=c(4,3,1,1,2,2,3),
status=c(1,1,1,0,1,1,0),
x=c(0,2,1,1,1,0,0),
sex=c(0,0,0,0,1,1,1))
# Fit a stratified model
coxph(Surv(time, status) ~ x + strata(sex), test1)
# Call:
# coxph(formula = Surv(time, status) ~ x + strata(sex), data = test1)
#
# coef exp(coef) se(coef) z p
# x 0.802 2.231 0.822 0.98 0.33
#
# Likelihood ratio test=1.09 on 1 df, p=0.3
# n= 7, number of events= 5
lhs = "Surv(time, status)"
rhs = "x + strata(sex)"
form = as.formula(paste(lhs, "~", rhs))
form
# Surv(time, status) ~ x + strata(sex)
## formula looks good
coxph(form, test1)
# Call:
# coxph(formula = form, data = test1)
#
# coef exp(coef) se(coef) z p
# x 0.802 2.231 0.822 0.98 0.33
两种方法的结果相同。