将包含具有相同名称的对象的多个.RData文件合并到一个.RData文件中

时间:2013-02-07 17:52:39

标签: r storage

我有很多.RData文件,其中包含我在之前分析中保存过的一个数据框,并且数据框对于每个加载的文件都具有相同的名称。所以例如使用load(file1.RData)我得到一个名为'df'的数据框,然后使用load(file2.RData)我得到一个名为'df'的数据框。我想知道是否可以将所有这些.RData文件合并到一个大的.RData文件中,因为我需要一次加载它们,每个df的名称等于文件名,这样我就可以使用不同的数据帧。

我可以使用下面的代码执行此操作,但它非常复杂,必须有一个更简单的方法来执行此操作...感谢您的建议。

假设我有3个.RData文件,并希望将所有文件保存在名为“main.RData”的文件中,并使用其特定名称(现在它们都以'df'形式出现):

all.files = c("/Users/fra/file1.RData", "/Users/fra/file2.RData", "/Users/fra/file3.RData")
assign(gsub("/Users/fra/", "", all.files[1]), local(get(load(all.files[1]))))
rm(list= ls()[!(ls() %in% (ls(pattern = "file")))])
save.image(file="main.RData")


all.files = all.files = c("/Users/fra/file1.RData", "/Users/fra/file2.RData", "/Users/fra/file3.RData")

for (f in all.files[-1]) {
  assign(gsub("/Users/fra/", "", f), local(get(load(f))))
  rm(list= ls()[!(ls() %in% (ls(pattern = "file")))])
  save.image(file="main.RData")
}

2 个答案:

答案 0 :(得分:3)

我认为我看到的最佳答案是下面的代码,我从SO答案中复制了这些答案,我现在无法追踪。向原作者道歉。

resave <- function(..., list = character(), file) {
   previous  <- load(file)
   var.names <- c(list, as.character(substitute(list(...)))[-1L])
   for (var in var.names) assign(var, get(var, envir = parent.frame()))
   save(list = unique(c(previous, var.names)), file = file)
}
#I took advantage of the fact the load function 
#returns the name of the loaded variables, so 
#I could use the function's environment instead of creating one.
#And when using get, I was careful to only look in the 
#environment from which the function is called, i.e. parent.frame()

答案 1 :(得分:3)

这是一个包含几个现有帖子的选项

all.files = c("file1.RData", "file2.RData", "file3.RData")

将多个数据帧读入一个命名列表(How can I load an object into a variable name that I specify from an R data file?

mylist<- lapply(all.files, function(x) {
  load(file = x)
  get(ls()[ls()!= "filename"])
})

names(mylist) <- all.files #Note, the names here don't have to match the filenames

您可以在保存(Unlist a list of dataframes

之前保存列表,或将数据帧传输到全局环境中
list2env(mylist ,.GlobalEnv)

或者,如果数据帧相同并且您想要创建单个大数据帧,则可以折叠列表并添加包含贡献文件名称的变量(Dataframes in a list; adding a new variable with name of dataframe)。

all <- do.call("rbind", mylist)
all$id <- rep(all.files, sapply(mylist, nrow))