WEKA关于大型训练数据集(java代码)

时间:2016-07-10 05:35:55

标签: java classification weka

我正在使用WEKA进行分类。我在我的Java代码中使用WEKA jar文件。我的训练数据集有56000个实例和1253个功能。我使用简单的分类算法,如逻辑回归,J48,随机森林随机树等。我只能获得随机森林的结果。在为其他分类器建立训练模型时,我的程序运行了6-7个小时,但我没有得到任何结果或错误。

任何人都可以建议一些更快的方法来训练大型数据集上的WEKA分类器。

谢谢!

1 个答案:

答案 0 :(得分:3)

由于weka的机器学习算法的实现将整个数据集加载到主存储器中,因此有时可能需要花费大量时间来训练模型。在这方面,通过命令行使用Weka可能会有所帮助。还有一些其他方法可以减少培训时间。他们被列入http://www.cs.waikato.ac.nz/ml/weka/bigdata.html

希望它有所帮助。