我目前已经在Hadoop中实现了Google构建决策树的框架(也称为PLANET)。它以单个顶点开始,并且在完全构建树之前,您会添加越来越多的map reduce作业。然而,一个主要问题是许多地图/减少工作一个接一个地运行,因此一直开始新工作的成本非常高。
我已经多次看到Apache Hama适合像图形这样的迭代算法。有人可以使用Hama构建一个新图形,或者您只需输入图形并对其进行一些计算?将我的项目转移到哈马会很容易吗?感谢
答案 0 :(得分:2)
Hama确实能够使用PLANET论文中描述的算法构建决策树,其方式比MapReduce更有效。
Hama不需要图形作为输入,您可以查看Hama ML(机器学习)模块,该模块通常直接从HDFS处理原始特征向量。
对于Hama,我创建了一个new issue in the Apache Jira来跟踪此算法的进度。