标签: r matrix tm
我用tm构建了一个文档 - 术语矩阵 R中包含18000个术语,其中大部分都不常见。我想删除频率小于0.0001的条款,以减少列数。
答案 0 :(得分:0)
removeSparseTerms(DocumentTermMatrix(corpus),0.995)
您可以根据需要更改稀疏参数