合并来自不同子目录的.txt文件
我有一个文件夹,里面装满了过去日期的子文件夹(例如01_14),在每个日期文件夹中有11个文件名为01.txt,02.txt ...如何合并所有.txt文件在一个数据框中,一列是从哪里来的文件夹的名称,另一列是文件名来自哪里?
我的层次结构看起来像这样:
\Data
\01_14
01.txt
02.txt
...
11.txt
\02_14
01.txt
02.txt
...
11.txt
\03_14
01.txt
02.txt
...
11.txt
答案 0 :(得分:0)
当我需要读取多个文件时,我使用read.stack辅助函数,它基本上是read.table的包装器,但它允许您在每个文件的基础上添加额外的列。以下是我如何在您的方案中使用它。
dir<-"Data"
subdir<-list.dirs(dir, recursive=F)
#get dir/file names
ff<-do.call(rbind, lapply(subdir, function(x) {
ff<-list.files(x, "\\.txt$", include.dirs = FALSE, full.names = TRUE)
data.frame(dir=basename(x), file=basename(ff),
fullpath=ff, stringsAsFactors=F)
}))
#read into data.frame
read.stack(ff$fullpath, extra=list(file=ff$file, dir=ff$dir))
答案 1 :(得分:0)
试试这个:
fileNames <- list.files("Data", recursive = TRUE, full.names = TRUE)
fileContents <- lapply(fileNames, function(fileName)
paste(readLines(fileName, warn = FALSE), collapse = "\n"))
meta <- regmatches(fileNames, regexec(".*Data/(.*)/(.*)$", fileNames))
merged <- mapply(c, fileContents, lapply(meta, "[", -1), SIMPLIFY = FALSE)
as.data.frame(t(do.call(cbind, merged)))