如何在Mahout中更改randomForest的源代码?

时间:2012-08-27 06:28:41

标签: hadoop mahout

在mahout中实现randomForest不处理大数据中的缺失值,它只是简单地跳过包含缺失值的所有行。

如果我想利用这个源代码来识别大数据中的错误值,我必须在源代码中进行哪些修改?

感谢, 拉库玛

1 个答案:

答案 0 :(得分:0)

你可以通过设置不跳过不良记录来解决mapreduce级别的问题。如果缺少值,这将失败工作