RapidMiner是否可以使用4GB RAM挖掘50,000个文档?

时间:2017-06-29 19:40:32

标签: text-mining rapidminer

我面临着以文本形式反馈处理50k行数据的挑战,我正在努力寻找减少维度的好方法。到目前为止,我已经使用了文本处理步骤 - 标记化 - 转换为低位 - 删除了停止词和词干,但它仍然提供了大约15,000的非常大的维度空间,其中包含没有含义的单词。我还能做些什么才能提取相关的单词?

0 个答案:

没有答案