Apache Hama适合构建决策树吗?

时间:2012-10-10 17:22:51

标签: java hadoop decision-tree hama

我目前已经在Hadoop中实现了Google构建决策树的框架(也称为PLANET)。它以单个顶点开始,并且在完全构建树之前,您会添加越来越多的map reduce作业。然而,一个主要问题是许多地图/减少工作一个接一个地运行,因此一直开始新工作的成本非常高。

我已经多次看到Apache Hama适合像图形这样的迭代算法。有人可以使用Hama构建一个新图形,或者您只需输入图形并对其进行一些计算?将我的项目转移到哈马会很容易吗?感谢

1 个答案:

答案 0 :(得分:2)

Hama确实能够使用PLANET论文中描述的算法构建决策树,其方式比MapReduce更有效。

Hama不需要图形作为输入,您可以查看Hama ML(机器学习)模块,该模块通常直接从HDFS处理原始特征向量。

对于Hama,我创建了一个new issue in the Apache Jira来跟踪此算法的进度。