应用错误收集

Hadoop用于超级O（N）或O（N log N）算法？

时间：2010-02-04 21:38:37

标签： hadoop linear

是否有任何记录在案的Hadoop适用于任何超过近似线性的算法？或者，巨大的数据集是否意味着任何高于线性的数据都是不可接受的？

我正在尝试找到在Hadoop上运行的算法，而不仅仅是排序/整合。

谢谢！

2 个答案:

答案 0 :(得分：1)

你看过Apache Mahout Project了吗？他们正在使用Hadoop实现机器学习算法（大多数算法都是这样做的。）

他们正在处理的算法列在他们的维基here上。

答案 1 :(得分：1)

以下是约50篇描述使用mapreduce（hadoop）算法的论文的概述： http://atbrox.com/2010/02/12/mapreduce-hadoop-algorithms-in-academic-papers-updated/ 在统计下分类的一些算法具有运行时间O（N ^ 2）