Hadoop用于超级O(N)或O(N log N)算法?

时间:2010-02-04 21:38:37

标签: hadoop linear

是否有任何记录在案的Hadoop适用于任何超过近似线性的算法?或者,巨大的数据集是否意​​味着任何高于线性的数据都是不可接受的?

我正在尝试找到在Hadoop上运行的算法,而不仅仅是排序/整合。

谢谢!

2 个答案:

答案 0 :(得分:1)

你看过Apache Mahout Project了吗?他们正在使用Hadoop实现机器学习算法(大多数算法都是这样做的。)

他们正在处理的算法列在他们的维基here上。

答案 1 :(得分:1)

以下是约50篇描述使用mapreduce(hadoop)算法的论文的概述: http://atbrox.com/2010/02/12/mapreduce-hadoop-algorithms-in-academic-papers-updated/ 在统计下分类的一些算法具有运行时间O(N ^ 2)