DocumentTermMatrix(c,控件= ...)vs removeSparseTerms()

时间:2019-04-18 23:25:12

标签: r tm

我是刚开始使用R进行文本挖掘,但是我难以理解在DocumentTermMatrix()中设置控件下限(例如list(global = c(lower,Inf)))之间的区别,而不是设置一个限制,但改用removeSparseTerms(corpus,percent)。

我使用了更低的= 0.005 * Number_of_docs和百分比= 0.995,并且每个都有不同的摘要。

0 个答案:

没有答案