使用R将多个文件融合并合并到一个数据库中

时间:2012-12-27 02:09:44

标签: r merge reshape2 melt

我一直在尝试导入几个csv文件,使用函数“melt”并将它们合并到R中的单个数据库中。所有文件都有一个“id”,“date.time”和“tag”列;但是,其余列在文件之间有所不同。这是文件中几行的示例:

               date.time   tag 111015 111016 113949 113950
1 1 2012-10-11 00:00:00 14767      0      0      0      0
2 2 2012-10-11 01:00:00 14767      0      0      0      0
3 3 2012-10-11 02:00:00 14767      0      0      0      0
4 4 2012-10-11 03:00:00 14767      0      0      0      0
5 5 2012-10-11 04:00:00 14767      0      0      0      0
6 6 2012-10-11 05:00:00 14767      0      0      0      0

library(reshape2)

# Import files

files<-list.files()
data<-lapply(files,read.csv,header=TRUE,sep=",",check.names=FALSE)

我正在尝试使用此循环来融合每个文件并绑定结果数据框。但是,它只适用于循环中的最后一个文件。我不知道如何设置循环/函数,以便它可以首先执行每个文件的“融化”,然后将它们“合并/绑定”到一个数据框中。

for(j in 1:length(data)){
   dm<-melt(data[[j]],measure.vars=c(4:length(data[[j]])),
     id=c("date.time","tag"),variable.name="receiver")

   results<-rbind(dm)   

  }

任何建议都将不胜感激!

1 个答案:

答案 0 :(得分:4)

最好先使用lapply加载所有内容,然后按以下方式使用melt :(假设您的所有文件都在变量files中,

Note: Untested 
require(reshape2)
files <- list.files(my.dir, full.names = TRUE)
# first load all files
dd <- lapply(1:length(files), function(idx) {
    d <-read.csv(files[idx], header = TRUE, sep=",", check.names = FALSE)
    # if you want the file index
    d$file.idx <- idx
    d
})
# merge all
dd <- do.call(rbind, dd)
# now melt
dd.m <- melt(dd, c(4:length(d)), c("date.time","tag"), variable.name = "receiver")

编辑:Op编辑后

Note: Untested 
require(reshape2)
files <- list.files(my.dir, full.names = TRUE)
dd.m <- lapply(1:length(files), function(idx) {
    # load the file
    d <-read.csv(files[idx], header = TRUE, sep=",", check.names = FALSE)
    # now melt immediately
    d.m <- melt(d, c("date.time","tag"), c(4:length(d)))
})
# merge all
dd.m <- do.call(rbind, dd.m)