我正在使用GATE Learning在java中进行机器学习。我有一个庞大的文档数据集可供学习。在使用netbeans时,我遇到了java堆空间错误。所以我在-Xmx参数中提供了1600MB。现在,我没有得到堆空间错误,但它需要足够的时间来运行! (跑了90分钟,我不得不停止这个过程,因为我失去了耐心!)。
我不明白我是否应该增加我的RAM(目前为4GB)或升级我的操作系统(目前是XP SP3,我听过vista并赢得7更好地利用RAM和处理器)或升级我的处理器(目前是双核E5500 2.80 GHz) )?
请深入了解我可以做些什么来使这个过程更快地运行!
谢谢Rishabh
答案 0 :(得分:1)
在你能够回答什么使它运行得更快之前,你必须找到瓶颈。
我对Windows不太熟悉,但有一些系统负载监控小部件,IIRC。
我会做的如下:
然后修复造成问题的那个。
仅仅针对上下文,ML算法在大型数据集上运行需要很长时间并不常见。您可以使用上述方法绘制运行时间,因为输入数据集的大小会增加,至少您会知道您的程序是否会在100分钟或100个世纪内停止。
答案 1 :(得分:1)