尽管文件路径正确,但DirSource返回空目录错误

时间:2018-09-25 04:27:10

标签: r tm

这似乎是一个非常基本的问题。该文件路径有效,我可以使用R中的其他方式打开文件,但我希望使用tm库。

docs <- Corpus(DirSource("C:/Users/xyz/Work/test.corpus.txt"), encoding = "UTF-8"))

抛出错误:

Error in inherits(x, "Source") : empty directory

编辑:

这与原始方法兼容:

docs <- Corpus(DirSource("C:/Users/xyz/Work/"), encoding = "UTF-8"))

显然,您不能指定单个文件名。解决方案是通过另一种方法读取文件,然后使用另一种源类型,例如VectorSource。

1 个答案:

答案 0 :(得分:1)

您可以指定一种模式,以便DirSource仅选择具有该模式的文件。对于所有txt文件,pattern =“ .txt”。或者,如果需要,pattern =“ test.corpus.txt”。像下面这样。

docs <- Corpus(DirSource("C:/Users/xyz/Work/", pattern = "test.corpus.txt", encoding = "UTF-8")