我正在使用'readtext'包在特定目录中导入多个文本文件。
library(readtext)
DATA_DIR <- system.file("extdata/", package = "readtext")
readtext(paste0(DATA_DIR, "/txt/UDHR/*"))
我的问题是:有什么方法可以根据标题导入文本文件? 我想导入标题中包含特定单词(例如apple)的文件。
谢谢您的帮助。
答案 0 :(得分:0)
这应该做您想要的。
# List all txt files including sub-folders
list_of_files <- list.files(path = "C:\\your_path_here\\", recursive = TRUE,
pattern = "the_run", full.names = TRUE)
library(data.table)
# Read all the files and create a FileName column to store filenames
DT <- rbindlist( sapply(list_of_files, fread, simplify = FALSE),
use.names = TRUE, idcol = "FileName" )
在这个愚蠢的示例中,我设置了一个父文件夹,其中包含3个子文件夹。在每个子文件夹中,我有5个文本文件:the_run1.txt,the_run2.txt,the_run3.txt,run1.txt和run2.txt。我正在找到父文件夹,并在所有子文件夹中查找文件名中带有“ the_run”的文本文件。就是这样我创建了这9个文件的列表(3个文件夹中的3个文件),并循环浏览该列表以将所有内容加载到单个数据表中。