如何使Weka API与MongoDB一起使用?

时间:2016-06-14 09:23:40

标签: mongodb weka

我希望使用WEKA来训练和预测MongoDB中的数据。具体来说,我打算使用Weka API来分析数据(例如,构建推荐引擎)。但我不知道如何继续,因为MongoDB中的数据以BSON格式存储,而WEKA使用ARFF格式。我想使用WEKA API从MongoDB读取数据,分析它,并实时向用户提供建议。我找不到WEKA和MongoDB之间的桥梁。

这是可能的还是我应该尝试另一种方法?

1 个答案:

答案 0 :(得分:0)

在开始之前,我应该说WEKA不是处理大数据的最佳工具。如果您确实拥有大数据,则可能需要使用Spark和Hadoop系列,因为它们更适合分析。

要按照书面回答您的问题,我建议您手动进行培训(即使用您可用的任何程序化工具创建培训文件)并预先培训模型。然后可以保存这些模型并相应地将其集成到程序中。

对于测试,您可以按照official instructions进行操作,但我通常会采用一些快捷方式:我通常会将数据预处理为类似CSV的格式(就像它进入ARFF文件一样)并且只是预先设置有效的ARFF标头(与培训文件使用的标头相同)。从那里,测试实例非常容易。根据我的经验,这极大地简化了编写实际进行新颖预测的代码的过程。