R:tm包读取新闻组数据

时间:2014-10-04 17:12:05

标签: r tm newsgroup

以下代码行返回以下错误:

">" object' readNewsgroup'找不到

library(tm)
setwd("C:/Users/DanRoDuq/Downloads/20news-bydate-train")
sci.electr.train=Corpus(DirSource("sci.electronics")
,readerControl=list(reader=readNewsgroup,language="en_US"))

我从http://qwone.com/~jason/20Newsgroups/lexData.text获取了数据,并下载了名为20news-bydate.tar.gz的文件

当我用readPlain替换readNewsgroup时,代码会运行,但我跟随的说明告诉我使用readNewsGroup设置。我可能要加载另一个库吗?

1 个答案:

答案 0 :(得分:3)

目前readNewsgroup - 版本(0.6)中不再有名为tm的读者。 使用getReaders(),您可以获得所有版本的读者。

按照您所遵循的说明下载相同的版本,应该有一个 readNewsgroup读者。