我有一个充满.doc文件的文件夹,我想将它们全部合并到R中,以创建一个数据帧,其中filename
作为一列,content
作为另一列(其中包括所有.doc文件中的内容。
这甚至可能吗?如果是这样,您能否为我提供有关如何执行此操作的概述?
我尝试通过使用以下代码使用readtext()
将所有文件转换为.txt格式开始:
DATA_DIR <- system.file("C:/Users/MyFiles/Desktop")
readtext(paste0(DATA_DIR, "/files/*.doc"))
我也尝试过:
setwd("C:/Users/My Files/Desktop")
我都无法工作(R的输出为Error in list_files(file, ignore_missing, TRUE, verbosity) : File '' does not exist.
),但是我不确定这对于我想做的事情是否必要。
很抱歉,这还很模糊;我想我首先要知道我想做的事是否可以完成。非常感谢!