在Uni学习大数据,我对MapReduce的主题感到困惑。我想知道有多少减速器可以同时运行。例如,假设我们有864个减速器,有多少可以同时运行?
答案 0 :(得分:1)
所有这些都可以同时运行,具体取决于群集的状态(运行状况,即没有胭脂/坏节点)是什么,群集的容量是多少以及群集的释放程度。如果在同一个集群上运行其他MR作业,则在864减速器中只有少数将进入运行状态,一旦容量空闲,则另一组减速器将开始运行。
还有一种情况有时发生在你的reducer / mapper继续抢占并占据整个记忆的时候。在大多数情况下,工作失败。为避免这种情况,我们通常设置较少的减速器。
答案 1 :(得分:0)
一行答案是 - 所有这些都可以同时运行;因为每个reducer在map reduce框架中执行一个独立的任务单元。
现在,有多少实际并行运行,或者更确切地说,当每个运行计划运行时,取决于许多因素,包括但不限于资源可用性,调度机制,集群配置等。