我正在使用我的数据来训练Weka NaiveBayes分类器。我正在运行交叉验证。当我运行5000个实例时,它运行得很好但是当我将实例数增加到100000时,它只是停留在那里显示:
'建立培训数据模型'
几秒钟后没有结果,weka停止处理数据。
答案 0 :(得分:1)
首先,请分享您的代码。你使用java api或通过GUI运行。 JVM的大小是多少。
可能的原因可能是
资源管理器中显示的文本输出是学习时产生的 所有可用数据的模型。这也是保存的模型 将序列化分类器导出到磁盘时。理由是 如果你要将模型投入生产以预测未来的实例 您想要使用从所有可用培训数据构建的模型。如果 你对这个型号不感兴趣,你可以关闭它(并节省时间) 在"更多选项"对话框。
答案 1 :(得分:0)
java vm可能内存不足。在RunWeka.ini中增加堆大小以解决此问题或者可能使用更少的数据。您可以在开始培训之前打开并保持打开CLI窗口,以便可以看到错误输出。