DocumentTermMatrix函数没有考虑R中语料库的所有术语

时间:2015-04-30 04:33:28

标签: r text-processing tm corpus term-document-matrix

我是R中tm包的新用户。我在语料库上运行以下代码,但DocumentTermMatrix的输出未考虑所有条款。

corpus = Corpus(VectorSource(text))
corpus = tm_map(corpus, PlainTextDocument)
dtm = DocumentTermMatrix(corpus)
dtm
# DocumentTermMatrix (documents: 20517, terms: 2)

它只显示两个术语,而我的数据集中有超过15个术语。有人可以帮忙吗?

0 个答案:

没有答案