我写了一个简单的函数:
myfunction <- function(fileName, stringsAsFactors=TRUE,
check.names=FALSE,
skip =1,...) {
Data <- read.delim(fileName, skip = skip,
stringsAsFactors=stringsAsFactors,
check.names = check.names, ...)
cb <- list()
Index <- as.numeric(as.factor(Data[,1]))
cb <- cbind(Data, Index)
return(cb)
}
此函数获取名为Data的文件的第一列,根据该第一列创建一个Index,然后cbind文件Data和创建的索引。
此函数将应用于名为myfile_00.txt
,myfile_01.txt
等文件中。
对于单个文件,它看起来像:
myfunction (fileName = "myfile_00.txt")
myfunction (fileName = "myfile_01.txt")
.......
我有大约1000个文件,所以我想,循环可以来自另一个帖子:
mytxt <- dir(pattern=".txt")
n <- length(mytxt)
mylist <- vector("list", n)
for(i in 1:n) {
mylist[[i]] <- read.delim(mytxt[i], header = F, skip = 1)
}
然后:
d <- lapply(mylist, myfunction)
不幸的是它不起作用......当使用lapply
时会发生错误:
Error in read.table(file = file, header = header, sep = sep, quote = quote, :
'file' must be a character string or connection
因为我是R的新人,我可能会犯错误,我无法弄明白。 有人可以帮帮我吗?
最好,
F。
答案 0 :(得分:4)
就像@Arun指出的那样,你试图运行你的函数两次:一次是在文件上,一次是你创建的数据框......相反,你的代码应该是这样的:
files <- list.files(pattern = ".txt")
mylist <- lapply(files, myfunction)