标签: hadoop mahout
在mahout中实现randomForest不处理大数据中的缺失值,它只是简单地跳过包含缺失值的所有行。
如果我想利用这个源代码来识别大数据中的错误值,我必须在源代码中进行哪些修改?
感谢, 拉库玛
答案 0 :(得分:0)
你可以通过设置不跳过不良记录来解决mapreduce级别的问题。如果缺少值,这将失败工作