是否有任何记录在案的Hadoop适用于任何超过近似线性的算法?或者,巨大的数据集是否意味着任何高于线性的数据都是不可接受的?
我正在尝试找到在Hadoop上运行的算法,而不仅仅是排序/整合。
谢谢!
答案 0 :(得分:1)
你看过Apache Mahout Project了吗?他们正在使用Hadoop实现机器学习算法(大多数算法都是这样做的。)
他们正在处理的算法列在他们的维基here上。
答案 1 :(得分:1)
以下是约50篇描述使用mapreduce(hadoop)算法的论文的概述: http://atbrox.com/2010/02/12/mapreduce-hadoop-algorithms-in-academic-papers-updated/ 在统计下分类的一些算法具有运行时间O(N ^ 2)