在多个文件上循环一个函数

时间:2013-02-18 13:10:15

标签: r

我写了一个简单的函数:

myfunction <- function(fileName, stringsAsFactors=TRUE,                 
                   check.names=FALSE,               
                   skip =1,...) {
Data <- read.delim(fileName, skip = skip,                     
                 stringsAsFactors=stringsAsFactors,                      
                 check.names = check.names, ...)                   
cb    <- list()                       
Index <- as.numeric(as.factor(Data[,1]))              
cb    <-  cbind(Data, Index)              
return(cb)           

}

此函数获取名为Data的文件的第一列,根据该第一列创建一个Index,然后cbind文件Data和创建的索引。 此函数将应用于名为myfile_00.txtmyfile_01.txt等文件中。 对于单个文件,它看起来像:

myfunction (fileName = "myfile_00.txt")
myfunction (fileName = "myfile_01.txt")
.......        

我有大约1000个文件,所以我想,循环可以来自另一个帖子:

mytxt  <- dir(pattern=".txt")      
n      <- length(mytxt)      
mylist <- vector("list", n)   
for(i in 1:n) {
    mylist[[i]] <- read.delim(mytxt[i], header = F, skip = 1)
}

然后:

d <- lapply(mylist, myfunction)

不幸的是它不起作用......当使用lapply时会发生错误:

Error in read.table(file = file, header = header, sep = sep, quote = quote,  : 
'file' must be a character string or connection

因为我是R的新人,我可能会犯错误,我无法弄明白。 有人可以帮帮我吗?

最好,

F。

1 个答案:

答案 0 :(得分:4)

就像@Arun指出的那样,你试图运行你的函数两次:一次是在文件上,一次是你创建的数据框......相反,你的代码应该是这样的:

files <- list.files(pattern = ".txt")
mylist <- lapply(files, myfunction)