mapreduce的缺点是什么? mapreduce有很多优点。但我也想知道mapreduce的缺点。
答案 0 :(得分:14)
当mapreduce不合适时,我宁愿问吗?如果您按预期使用它,我认为您不会看到任何不利之处。话虽如此,有些情况下mapreduce不是一个合适的选择:
可能还有其他一些案例。但重要的是你使用它有多好。例如,您不能指望MR作业在几毫秒内给出结果。你不能把它算作它的劣势。只是你在错误的地方使用它。它适用于任何技术,恕我直言。长话短说,在你采取行动之前要好好思考。
如果你还想要,可以采取以上几点作为mapreduce的缺点:)
HTH
答案 1 :(得分:3)
以下是MapReduce无法正常工作的一些用例。
答案 2 :(得分:1)
首先,流式传输地图输出,如果可以将其保留在内存中,则效率会更高。我最初使用MPI部署了我的算法但是当我扩展一些节点开始交换时,这就是我进行转换的原因。
Namenode会跟踪分布式文件系统中所有文件的元数据。我正在阅读一本hadoop书(Hadoop in action),它提到雅虎估计每个文件的元数据大约为600字节。这意味着如果您有太多文件,您的Namenode可能会遇到问题。
如果您不想使用流媒体API ,则必须使用 java 语言编写程序。我举例说来自C ++的翻译。这有一些副作用,例如Java与C相比有很大的字符串开销。因为我的软件都是关于字符串的,所以这是一种缺点。
说实话,我真的不得不努力寻找缺点。 mapreduce解决的问题比它引入的问题要大得多。 这个列表绝对不完整,只是几个第一个评论。显然,你必须记住,它是面向大数据,而这正是它将发挥最佳性能的地方。还有很多其他的分发框架都有自己的特点。
答案 3 :(得分:1)