在完成这个简单的例子之后,我刚刚在UCI的玻璃数据上尝试了BreimanExample:
https://cwiki.apache.org/MAHOUT/breiman-example.html
我的问题是,一旦我在Mahout中创建了一个RandomForest,我如何“加载它”以便用它做出预测?
使用Python中的sklearn这很简单,只需将森林腌制到磁盘并稍后加载,将其放在Web服务器后面进行实时交互,这很容易。
但与Mahout和Hadoop相比呢?如果我大规模构建一个RandomForest,我如何捕获并使用输出来进行未来的预测?
答案 0 :(得分:1)
尝试按照此示例:https://cwiki.apache.org/MAHOUT/partial-implementation.html BuildForest用于构建模型,TestForest代码将向您展示如何加载模型以进行预测。