一个基本问题。我有一堆成绩单(.docx文件)要读入语料库。我使用readtext()读取单个文件没有问题。
dat <- readtext("~/ownCloud/NLP/interview_1.docx")
在我的readtext语句中放入“ * .docx”后,它立即显示错误。
dat <- readtext("~/ownCloud/NLP/*.docx")
Error: '/var/folders/bl/61g7ngh55vs79cfhfhnstd4c0000gn/T//RtmpWD6KSx/readtext-aa71916b691c0cf3cabc73a2e04a45f7/word/document.xml' does not exist.
In addition: Warning message:
In utils::unzip(file, exdir = path) : error 1 in extracting from zip file
为什么引用一个zip文件?我的目录中只有.docx个文件。
答案 0 :(得分:0)
我能够重现同样的问题。问题是该文件夹中有一些隐藏/临时.docx
文件,如果您删除它们然后尝试使用它的代码,则该文件。
要查看隐藏的文件,请转至正在读取docx
文件的文件夹,然后根据您的操作系统选择一种显示它们的方法。在我使用的Mac上,
CMD + SHIFT + .
删除它们后,请再次尝试代码,它应该可以工作
library(readtext)
dat <- readtext("~/ownCloud/NLP/*.docx")