R中函数内的函数

时间:2012-09-01 12:25:58

标签: r

您能否向我解释为什么代码会抱怨说找不到Samdat

我试图在模型之间切换,所以我声明了一个包含这些特定模型的函数,我只需要将此函数作为get.f函数中的一个参数调用,其中重新采样将改变结构模型中的每个设计矩阵。代码抱怨找不到Samdat

另外,有没有办法可以创建条件语句if(Model == M1()),而不必创建另一个参数M来设置if(M==1)

这是我的代码:

dat <-  cbind(Y=rnorm(20),rnorm(20),runif(20),rexp(20),rnorm(20),runif(20), rexp(20),rnorm(20),runif(20),rexp(20))
nam <- paste("v",1:9,sep="")
colnames(dat) <- c("Y",nam)

M1 <- function(){
    a1 = cbind(Samdat[,c(2:5,7,9)])
    b1 = cbind(Samdat[,c(2:4,6,8,7)])
    c1 = b1+a1
    list(a1=a1,b1=b1,c1=c1)}

M2 <- function(){
    a1= cbind(Samdat[,c(2:5,7,9)])+2
    b1= cbind(Samdat[,c(2:4,6,8,7)])+2
    c1 = a1+b1
    list(a1=a1,b1=b1,c1=c1)}

M3 <- function(){
    a1= cbind(Samdat[,c(2:5,7,9)])+8
    b1= cbind(Samdat[,c(2:4,6,8,7)])+8
    c1 = a1+b1
    list(a1=a1,b1=b1,c1=c1)}
#################################################################
get.f <- function(asim,Model,M){
    sse <-c()
    for(i in 1:asim){
        set.seed(i)
        Samdat <- dat[sample(1:nrow(dat),nrow(dat),replace=T),]
        Y <- Samdat[,1]
        if(M==1){
            a2 <- Model$a1
            b2 <- Model$b1
            c2 <- Model$c1
            s<- a2+b2+c2
            fit <- lm(Y~s)
            cof <- sum(summary(fit)$coef[,1])
            coff <-Model$cof
            sse <-c(sse,coff)
        }
        else if(M==2){
            a2 <- Model$a1
            b2 <- Model$b1
            c2 <- Model$c1
            s<- c2+12
            fit <- lm(Y~s)
            cof <- sum(summary(fit)$coef[,1])
            coff <-Model$cof
            sse <-c(sse,coff)
        }
        else {
            a2 <- Model$a1
            b2 <- Model$b1
            c2 <- Model$c1
            s<- c2+a2
            fit <- lm(Y~s)
            cof <- sum(summary(fit)$coef[,1])
            coff <- Model$cof
            sse <-c(sse,coff)
        }
    }
    return(sse)
}

get.f(10,Model=M1(),M=1)
get.f(10,Model=M2(),M=2)
get.f(10,Model=M3(),M=3)

2 个答案:

答案 0 :(得分:9)

您可能想查看R scoping rules。特别是,没有理由期望在函数中定义的变量在其他函数中可见。

您可能会感到困惑,因为全局环境(即所有函数外的顶层)是此规则的例外。我不打算回答你的其他问题,但让我注意到整个脚本看起来很混乱 - 即M1M3本质上是一个函数,而复制/一团粘贴get.f绝对是可怕的。无论你想做什么,都可以用一种不太复杂的方式写出来。

让我们首先看一下M - 为什么没有一个带参数的函数?包括范围问题的解决方案,它产生两个参数 -

M <- function(sampleData, offset) { 
    a1 = sampleData[,c(2:5,7,9)] + offset
    b1 = sampleData[,c(2:4,6,8,7)] + offset
    c1 = b1+a1
    list(a1=a1,b1=b1,c1=c1)
}

如果您坚持定义别名,您也可以执行类似

的操作
M1 <- function(sampleData) M(sampleData, 0) 
M2 <- function(sampleData) M(sampleData, 2) 
M3 <- function(sampleData) M(sampleData, 8) 

这已经不那么重复,但理想情况下你希望计算机为你做重复(DRY!):

offsets <- c(0,2,8)
Models <- sapply(offsets, FUN=function(offset) function(sampleData) M(sampleData, offset))

关注get.f,你要做的事情并不十分清楚 - 你正在尝试适应某些东西并从结果中收集一些东西,但关于Model$cof的部分是指未定义的变量(您的Model只有a1b1c1条目。假设您要实际收集cof并丢弃临时代码,get.f可能如下所示:

M <- function(sampleData, offset) { 
    a1 = sampleData[,c(2:5,7,9)] + offset
    b1 = sampleData[,c(2:4,6,8,7)] + offset
    c1 = b1+a1
    list(a1=a1,b1=b1,c1=c1)
}

get.f <- function(asim,Model,M){
    sse <-c()
    for(i in 1:asim){
        set.seed(i)
        Samdat <- dat[sample(1:nrow(dat),nrow(dat),replace=T),]
        Y <- Samdat[,1]
        model <- Model()
        if(M==1){
            a2 <- model$a1
            b2 <- model$b1
            c2 <- model$c1
            s<- a2+b2+c2
            fit <- lm(Y~s)
            cof <- sum(summary(fit)$coef[,1])
            sse <-c(sse,cof)
        }
        else if(M==2){
            a2 <- model$a1
            b2 <- model$b1
            c2 <- model$c1
            s<- c2+12
            fit <- lm(Y~s)
            cof <- sum(summary(fit)$coef[,1])
            sse <-c(sse,cof)
        }
        else {
            a2 <- model$a1
            b2 <- model$b1
            c2 <- model$c1
            s<- c2+a2
            fit <- lm(Y~s)
            cof <- sum(summary(fit)$coef[,1])
            sse <-c(sse,cof)
        }
    }
    return(sse)
}


get.f(10,Model=M1,M=1) 
get.f(10,Model=M2,M=2)
get.f(10,Model=M3,M=3)

那仍然非常重复,所以我们为什么不考虑一下呢?您对样品所做的一切就是从它们中计算出一列用于您的样品。我不明白为什么你需要在M函数中进行计算,然后在get.f中提取单个值(取决于你使用的特定M) - 这似乎表明提取应该更多地是M的一部分...但是如果你需要将它们分开,那么,让我们使用单独的提取功能。在合理编写的R中仍然有一半的代码大小:

# Set up test data
dat <-  cbind(Y=rnorm(20),rnorm(20),runif(20),rexp(20),rnorm(20),runif(20), rexp(20),rnorm(20),runif(20),rexp(20))
nam <- paste("v",1:9,sep="")
colnames(dat) <- c("Y",nam)

# calculate a1..c1 from a sample
M <- function(sampleData, offset) { 
    a1 = sampleData[,c(2:5,7,9)] + offset
    b1 = sampleData[,c(2:4,6,8,7)] + offset
    c1 = b1+a1
    list(a1=a1,b1=b1,c1=c1)
}

# create a fixed-offset model from the variable offset model by fixing offset
makeModel <- function(offset) function(sampleData) M(sampleData, offset)   

# run model against asim subsamples of data and collect coefficients
get.f <- function(asim,model,expected) 
    sapply(1:asim,  function (i){
        set.seed(i)
        Samdat <- dat[sample(1:nrow(dat),nrow(dat),replace=T),]
        Y <- Samdat[,1]
        s <- expected(model(Samdat))
        fit <- lm(Y~s)
        sum(summary(fit)$coef[,1])
    })

# list of models to run and how to extract the expectation values from the model reslts
todo <- list(
        list(model=makeModel(0), expected=function(data) data$a1+data$b1+data$c1),
        list(model=makeModel(2), expected=function(data) data$c1+12),
        list(model=makeModel(8), expected=function(data) data$c1+data$a1))

sapply(todo, function(l) { get.f(10, l$model, l$expected)})

答案 1 :(得分:4)

致电时

get.f(10, Model=M1(), M=1)

立即调用您的M1函数。它会在M1的正文中消失,因为Samdat只在get.f的正文中使用M1

不知何故,您需要在定义 Samdat后致电M1 。这样做的一种方法是使get.f(函数)成为get.f的参数并从get.f <- function(asim, Model.fun, M) { ... Sambat <- ... Model <- Model.fun() ... } get.f(10, Model.fun = M1, M=1) 内部调用函数:

M1

另外,一般来说,使用全局变量编程很糟糕,即使函数使用在其范围之外定义的变量。相反,建议将函数使用的所有内容作为输入参数传递。您的代码中有两种此类情况:M2M3Samdat)使用get.fdat使用M1 <- function(sampled.data) { a1 <- sampled.data[, c("v1", "v2", "v3", "v4", "v6", "v8")] b1 <- sampled.data[, c("v1", "v2", "v3", "v5", "v7", "v6")] c1 <- a1 + b1 list(a1 = a1, b1 = b1, c1 = c1) } get.f <- function(dat, asim, Model.fun, offset, M) { sse <- c() for(i in 1:asim){ set.seed(i) Samdat <- dat[sample(1:nrow(dat), nrow(dat), replace = TRUE), ] Y <- Samdat[, "Y"] Model <- Model.fun(sampled.data = Samdat) a2 <- Model$a1 b2 <- Model$b1 c2 <- Model$c1 s <- switch(M, a2 + b2 + c2, c2 + 12, c2 + a2) fit <- lm(Y ~ s) cof <- sum(summary(fit)$coef[,1]) coff <- Model$cof # there is a problem here... sse <- c(sse, coff) # this is not efficient } return(sse) } dat <- cbind(Y = rnorm(20), v1 = rnorm(20), v2 = runif(20), v3 = rexp(20), v4 = rnorm(20), v5 = runif(20), v6 = rexp(20), v7 = rnorm(20), v8 = runif(20), v9 = rexp(20)) get.f(dat, 10, Model.fun = M1, M = 1) 。它们应该是你的功能的参数。这是一个更好的代码版本。我还没有解决所有问题,所以你必须多做一些才能让它发挥作用:

s

跳出来的最后一件事:如果switch()的定义(我在Model下收集的内容与您使用的Model相关,那么请考虑合并{{1}的定义}和s一起:将s添加到M1M2M3函数的列表输出中,以便s可以定义为s <- Model$s,然后您可以将M输入放到get.f