标签: r tm
我是刚开始使用R进行文本挖掘,但是我难以理解在DocumentTermMatrix()中设置控件下限(例如list(global = c(lower,Inf)))之间的区别,而不是设置一个限制,但改用removeSparseTerms(corpus,percent)。
我使用了更低的= 0.005 * Number_of_docs和百分比= 0.995,并且每个都有不同的摘要。