通过字符串创建公式调用

时间:2018-09-19 19:30:38

标签: r formula cox-regression

我使用最佳子集选择包来确定用于构建模型的最佳独立变量(我确实有这样做的特定原因,而不是直接使用最佳子集对象)。我想以编程方式提取特征名称,并使用生成的字符串构建模型公式。结果将是这样的:

x <- "x1 + x2 + x3"
y <- "Surv(time, event)"

因为我正在构建coxph模型,所以公式如下:

coxph(Surv(time, event) ~ x1 + x2 + x3)

使用这些字符串字段,我试图像这样构造公式:

form <- y ~ x

这将创建一个formula类的对象,但是当我调用coxph时,它不会基于从公式对象创建的引用进行评估。我收到以下错误:

Error in model.frame.default(formula = y ~ x) : object is not a matrix

如果在eval调用中对对象y和x调用coxph,则会得到以下信息:

Error in model.frame.default(formula = eval(y) ~ eval(x), data = df) : 

可变长度不同(为'eval(x)'找到)

我不太确定该如何进行。感谢您的输入。

1 个答案:

答案 0 :(得分:1)

找不到好听的骗子,所以发表评论作为答案。

如果您将完整的公式构建为字符串,包括~,则可以在其上使用as.formula,例如

x = "x1 + x2 + x3"
y = "Surv(time, event)"
form = as.formula(paste(y, "~", x))
coxph(form, data = your_data)

有关可重现的示例,请考虑?coxph帮助页面底部的第一个示例:

library(survival)
test1 <- list(time=c(4,3,1,1,2,2,3), 
              status=c(1,1,1,0,1,1,0), 
              x=c(0,2,1,1,1,0,0), 
              sex=c(0,0,0,0,1,1,1)) 
# Fit a stratified model 
coxph(Surv(time, status) ~ x + strata(sex), test1)
# Call:
# coxph(formula = Surv(time, status) ~ x + strata(sex), data = test1)
# 
#    coef exp(coef) se(coef)    z    p
# x 0.802     2.231    0.822 0.98 0.33
# 
# Likelihood ratio test=1.09  on 1 df, p=0.3
# n= 7, number of events= 5 

lhs = "Surv(time, status)"
rhs = "x + strata(sex)"
form = as.formula(paste(lhs, "~", rhs))
form
# Surv(time, status) ~ x + strata(sex)
## formula looks good

coxph(form, test1)
# Call:
# coxph(formula = form, data = test1)
# 
#    coef exp(coef) se(coef)    z    p
# x 0.802     2.231    0.822 0.98 0.33

两种方法的结果相同。