无法访问tm.corpus.Reuter21578

时间:2014-01-01 09:36:05

标签: r tm

我正在开发一个必须将推文与新闻相关联的项目。任何想法怎么可能?我试图访问R中的tm.corpus.Reuters21578包,但是当我执行以下代码时,我收到错误。

library(tm)
corpus <- Corpus(DirSource("Data/reuters"), list(reader = readReut21578XML))

收到错误:      DirSource中的错误(“数据/路透社”):空目录

1 个答案:

答案 0 :(得分:0)

请改为尝试:

corpus <- Corpus(DirSource(reut21578),
    readerControl = list(reader = readReut21578XML))