文本挖掘大数据框与tm挂起。

时间:2013-10-03 13:43:22

标签: r text-mining tm

我正在使用R包tm运行一些文本挖掘分析。当我将数据加载到语料库并尝试运行

searches <- tm_map(searches, stripWhitespace)
searches <- tm_map(searches, tolower)
searches <- tm_map(searches, removeWords)

查询似乎挂在我身上,需要很长时间才能完成。我得到了500k行搜索查询之间的东西。如何最好地在这个大型数据集上运行tm包命令,而不会占用我的内存和机器挂在我身上。

仅供参考 - 我的机器上有超过8GB的内存。

0 个答案:

没有答案