根据R中最常用的术语构建文档术语矩阵

时间:2015-05-22 20:59:06

标签: r matrix tm

我用tm构建了一个文档 - 术语矩阵 R中包含18000个术语,其中大部分都不常见。我想删除频率小于0.0001的条款,以减少列数。

1 个答案:

答案 0 :(得分:0)

removeSparseTerms(DocumentTermMatrix(corpus),0.995)

您可以根据需要更改稀疏参数