所以我在这个Hadoop世界中是新手,我试图了解地图绘制器和减速器是如何工作的,我的问题(和问题)是:
我有一个很长的映射器,在生成[key,value]对之前需要生成一些中间文件。例如,在整个映射器中:文件A和B作为输入,我需要一个输出文件E,其中包含一些无法减少的中间文件。
file A -> file C
file B -> file D
file C + file D -> file E
是否有可能实现这一目标?中间文件是否留在节点中?
答案 0 :(得分:1)
这在传统上是不可能实现的。 但有两种方法是可能的: