如何使用R导入基于标题的多个文本文件?

时间:2018-11-01 10:16:27

标签: r read-text

我正在使用'readtext'包在特定目录中导入多个文本文件。

library(readtext)
DATA_DIR <- system.file("extdata/", package = "readtext")
readtext(paste0(DATA_DIR, "/txt/UDHR/*"))

我的问题是:有什么方法可以根据标题导入文本文件? 我想导入标题中包含特定单词(例如apple)的文件。

谢谢您的帮助。

1 个答案:

答案 0 :(得分:0)

这应该做您想要的。

# List all txt files including sub-folders
list_of_files <- list.files(path = "C:\\your_path_here\\", recursive = TRUE,
                            pattern = "the_run", full.names = TRUE)

library(data.table)

# Read all the files and create a FileName column to store filenames
DT <- rbindlist( sapply(list_of_files, fread, simplify = FALSE),
                 use.names = TRUE, idcol = "FileName" )

在这个愚蠢的示例中,我设置了一个父文件夹,其中包含3个子文件夹。在每个子文件夹中,我有5个文本文件:the_run1.txt,the_run2.txt,the_run3.txt,run1.txt和run2.txt。我正在找到父文件夹,并在所有子文件夹中查找文件名中带有“ the_run”的文本文件。就是这样我创建了这9个文件的列表(3个文件夹中的3个文件),并循环浏览该列表以将所有内容加载到单个数据表中。