标签: hadoop mapreduce
我听说map任务将其数据保留在磁盘上。但这会使mapreduce变慢,特别是对于迭代算法。 为什么我们要将中间输出保留到磁盘? 为什么我们不直接将输出发送到下一个阶段而不将中间输出持久化到磁盘?