这似乎是一个非常基本的问题。该文件路径有效,我可以使用R中的其他方式打开文件,但我希望使用tm
库。
docs <- Corpus(DirSource("C:/Users/xyz/Work/test.corpus.txt"), encoding = "UTF-8"))
抛出错误:
Error in inherits(x, "Source") : empty directory
编辑:
这与原始方法兼容:
docs <- Corpus(DirSource("C:/Users/xyz/Work/"), encoding = "UTF-8"))
显然,您不能指定单个文件名。解决方案是通过另一种方法读取文件,然后使用另一种源类型,例如VectorSource。
答案 0 :(得分:1)
您可以指定一种模式,以便DirSource
仅选择具有该模式的文件。对于所有txt文件,pattern =“ .txt”。或者,如果需要,pattern =“ test.corpus.txt”。像下面这样。
docs <- Corpus(DirSource("C:/Users/xyz/Work/", pattern = "test.corpus.txt", encoding = "UTF-8")