在readtext()中使用通配符

时间:2019-08-18 02:33:34

标签: r quanteda

一个基本问题。我有一堆成绩单(.docx文件)要读入语料库。我使用readtext()读取单个文件没有问题。

dat <- readtext("~/ownCloud/NLP/interview_1.docx")

在我的readtext语句中放入“ * .docx”后,它立即显示错误。

dat <- readtext("~/ownCloud/NLP/*.docx")

Error: '/var/folders/bl/61g7ngh55vs79cfhfhnstd4c0000gn/T//RtmpWD6KSx/readtext-aa71916b691c0cf3cabc73a2e04a45f7/word/document.xml' does not exist.
In addition: Warning message:
In utils::unzip(file, exdir = path) : error 1 in extracting from zip file

为什么引用一个zip文件?我的目录中只有.docx个文件。

1 个答案:

答案 0 :(得分:0)

我能够重现同样的问题。问题是该文件夹中有一些隐藏/临时.docx文件,如果您删除它们然后尝试使用它的代码,则该文件。

要查看隐藏的文件,请转至正在读取docx文件的文件夹,然后根据您的操作系统选择一种显示它们的方法。在我使用的Mac上,

CMD + SHIFT + .

删除它们后,请再次尝试代码,它应该可以工作

library(readtext)
dat <- readtext("~/ownCloud/NLP/*.docx")