我阅读了很多参考文献,书中的章节&文章,但我仍然试图把所有东西粘在一起:
我非常了解MapReduce逻辑链,但我特别想知道随着时间的推移在哪个物理节点上启动了哪些特定的进程。
我猜mappers是在网站上执行的#34;"在datanode机器上,但是需要通过多个数据节点访问数据的其他流程,特别是减速器呢?
另外,如果我做得好,地图和减少编写的程序将在执行命令的主节点上启动,并导致在整个群集中的新JVM上启动新线程,是吗?
答案 0 :(得分:0)
我建议您访问http://bytepadding.com/map-reduce/
给你一个概述。