我有很多.RData文件,其中包含我在之前分析中保存过的一个数据框,并且数据框对于每个加载的文件都具有相同的名称。所以例如使用load(file1.RData)我得到一个名为'df'的数据框,然后使用load(file2.RData)我得到一个名为'df'的数据框。我想知道是否可以将所有这些.RData文件合并到一个大的.RData文件中,因为我需要一次加载它们,每个df的名称等于文件名,这样我就可以使用不同的数据帧。
我可以使用下面的代码执行此操作,但它非常复杂,必须有一个更简单的方法来执行此操作...感谢您的建议。
假设我有3个.RData文件,并希望将所有文件保存在名为“main.RData”的文件中,并使用其特定名称(现在它们都以'df'形式出现):
all.files = c("/Users/fra/file1.RData", "/Users/fra/file2.RData", "/Users/fra/file3.RData")
assign(gsub("/Users/fra/", "", all.files[1]), local(get(load(all.files[1]))))
rm(list= ls()[!(ls() %in% (ls(pattern = "file")))])
save.image(file="main.RData")
all.files = all.files = c("/Users/fra/file1.RData", "/Users/fra/file2.RData", "/Users/fra/file3.RData")
for (f in all.files[-1]) {
assign(gsub("/Users/fra/", "", f), local(get(load(f))))
rm(list= ls()[!(ls() %in% (ls(pattern = "file")))])
save.image(file="main.RData")
}
答案 0 :(得分:3)
我认为我看到的最佳答案是下面的代码,我从SO答案中复制了这些答案,我现在无法追踪。向原作者道歉。
resave <- function(..., list = character(), file) {
previous <- load(file)
var.names <- c(list, as.character(substitute(list(...)))[-1L])
for (var in var.names) assign(var, get(var, envir = parent.frame()))
save(list = unique(c(previous, var.names)), file = file)
}
#I took advantage of the fact the load function
#returns the name of the loaded variables, so
#I could use the function's environment instead of creating one.
#And when using get, I was careful to only look in the
#environment from which the function is called, i.e. parent.frame()
答案 1 :(得分:3)
这是一个包含几个现有帖子的选项
all.files = c("file1.RData", "file2.RData", "file3.RData")
将多个数据帧读入一个命名列表(How can I load an object into a variable name that I specify from an R data file?)
mylist<- lapply(all.files, function(x) {
load(file = x)
get(ls()[ls()!= "filename"])
})
names(mylist) <- all.files #Note, the names here don't have to match the filenames
您可以在保存(Unlist a list of dataframes)
之前保存列表,或将数据帧传输到全局环境中list2env(mylist ,.GlobalEnv)
或者,如果数据帧相同并且您想要创建单个大数据帧,则可以折叠列表并添加包含贡献文件名称的变量(Dataframes in a list; adding a new variable with name of dataframe)。
all <- do.call("rbind", mylist)
all$id <- rep(all.files, sapply(mylist, nrow))