我是R中tm
包的新用户。我在语料库上运行以下代码,但DocumentTermMatrix
的输出未考虑所有条款。
corpus = Corpus(VectorSource(text))
corpus = tm_map(corpus, PlainTextDocument)
dtm = DocumentTermMatrix(corpus)
dtm
# DocumentTermMatrix (documents: 20517, terms: 2)
它只显示两个术语,而我的数据集中有超过15个术语。有人可以帮忙吗?