麻烦传递参数在自己的函数内运行

时间:2013-02-18 10:10:30

标签: r function environment argument-passing

我正在编写一个函数,我希望将一些参数传递给crrstep-function('crrstep'包),但我遇到了一个问题:当我输入它时,我的函数中的参数'event'无法识别在crrstep。我想crrstep看起来与我想要的环境不同,但即使经过几个小时的网络搜索解决方案,我似乎无法弄清楚如何解决这个问题(我在编程方面经验不足......) 。任何帮助将不胜感激!

以下是一些模拟数据(来自crrstep文档的调整示例)和我的代码示例:

n <- 500
ftime <- rexp(n)
fstatus <- sample(0:2,n,replace=TRUE)
testdata <- matrix(runif(8*n),nrow=n)
testdata <- cbind(ftime,fstatus,testdata)
dimnames(testdata)[[2]] <- c('ftime','fstatus','x1','x2','x3','x4','x5','x6','x7','x8')
testdata <- as.data.frame(testdata)
formula1 <- ftime ~ 1 + x1 + x2 + x3 + x4 + x5 + x6 + x7 + x8
rm(fstatus,ftime,n)

test.fun <- function(x,data,event){
require(crrstep)
select.mod<- crrstep(formula=x,,etype=event, failcode=1, cencode=0,data=data, 
                   direction = "backward", criterion = "AIC", crr.object = TRUE, 
                   trace = FALSE)
#Rest of function omitted for now
print(select.mod)
}

#Test
test.fun(x=formula1,data=testdata,event=fstatus) 
#I get: Error in eval(expr, envir, enclos) : object 'event' not found"

非常感谢! 罗布

2 个答案:

答案 0 :(得分:5)

在依赖于评估数据框中的名称的函数中调用函数时,我使用do.call,它在传递给函数之前计算其参数,因此调试和编写代码更简单,我觉得我可以更确定它正在做什么。 (对于调试,只需使用call而不是do.call,这将显示函数将尝试运行的内容;语法也有所不同,因此在执行此操作时也会删除调用中的列表结构。)

(感谢Josh O'Brien在这里提出这个想法的答案:https://stackoverflow.com/a/7668846/210673

在这种情况下,它看起来像这样:

test.fun <- function(x, data, event){
  require(crrstep)
  select.mod <- do.call("crrstep", 
         list(formula=x, etype=substitute(event), failcode=1, cencode=0,
              data=as.name("data"), direction = "backward", criterion = "AIC", 
              crr.object = TRUE, trace = FALSE))
  print(select.mod)
}

test.fun(x=formula1, data=testdata, event=fstatus) 

substitute(event)告诉它使用为函数指定的名称,而不是名称eventas.name("data")告诉它在函数中查找data而不是传递实际数据帧。另一个选项是substitute(data),它将查找您拥有的实际数据框。

使用lm

的示例

以下是使用lmweights参数的非常相似行为的示例:

这是一个示例数据集和对lm的调用,而不是在另一个函数内。我打印响应的call元素,看看它实际上做了什么。

> set.seed(5)
> dd <- data.frame(x=1:10,y=round(rnorm(10,mean=10),1), z=round(runif(10,1,4),1))
> lm(y~x, weights=z, data=dd)$call
lm(formula = y ~ x, data = dd, weights = z)

自然方式,因为它在数据框中寻找w而无效:

> f1 <- function(f,w,d){
+   lm(formula=f,weights=w, data=d)
+ }
> f1(y~x, z, dd)
Error in eval(expr, envir, enclos) : object 'w' not found

可以使用字符串构建调用;这有点简单:

> f2 <- function(f,w,d){
+   do.call("lm", list(formula=as.formula(f), weights=as.name(w), data=as.name(d)))
+ }
> f2("y~x", "z", "dd")$call
lm(formula = y ~ x, data = dd, weights = z)

或者可以使用substitute;这里我在实际数据集dd上调用函数,而不是函数中的d。如果我想使用update,这可能会有用。

> f3 <- function(f,w,d){
+   do.call("lm", list(formula=f, weights=substitute(w), data=substitute(d)))
+ }
> f3(y~x, z, dd)$call
lm(formula = y ~ x, data = dd, weights = z)

但我也可以在函数中使用d;这次请注意调用中的data = d而不是data = dd

> f4 <- function(f,w,d){
+   do.call("lm", list(formula=f, weights=substitute(w), data=as.name("d")))
+ }
> f4(y~x, z, dd)$call
lm(formula = y ~ x, data = d, weights = z)

它也可以放入实际的数据框,但是调用时间更长。但是,如果您在每次调用之前以编程方式更改数据框并希望记录该数据帧是什么,则可能需要这样做。 (不过,我的偏好是以更明确的方式保存该数据框,如果你以后真的想要它。)

> f5 <- function(f,w,d){
+   do.call("lm", list(formula=f, weights=substitute(w), data=d))
+ }
> f5(y~x, z, dd)$call
lm(formula = y ~ x, data = list(x = 1:10, y = c(9.2, 11.4, 8.7, 
10.1, 11.7, 9.4, 9.5, 9.4, 9.7, 10.1), z = c(3.7, 3.2, 1.6, 1.7, 
1.4, 2.4, 2.3, 3.9, 1.4, 3.9)), weights = z)

另外还有一项信息表明,在substitute的调用中do.call执行substitute时,您不能只使用lm > f6 <- function(f,w,d){ + lm(formula=f,weights=substitute(w), data=d) + } > f6(y~x, z, dd) Error in model.frame.default(formula = f, data = d, weights = substitute(w), : invalid type (symbol) for variable '(weights)'

{{1}}

答案 1 :(得分:0)

我不明白为什么,但如果您将etype参数作为索引数据框传递,它似乎会失败。但是,如果您事先创建了矢量,它似乎有效:

test.fun <- function(x,data,event){
  require(crrstep)
  etype <- data[,event]
  select.mod<- crrstep(formula=x,data=data,etype=etype, failcode=1, cencode=0, 
                   direction = "backward", criterion = "AIC", crr.object = TRUE, 
                   trace = FALSE)
#Rest of function omitted for now
print(select.mod)
}