应用错误收集

在多应用程序群集环境中，在 Hadoop YARN 内运行的作业的优先级可能低于在 Hadoop YARN 之外运行的作业（如HBase）。为了让位于Hadoop内的其他更高优先级的作业，用户或某些集群级资源调度 服务应该能够暂停和/或恢复Hadoop YARN中的某些特定作业

当Hadoop中的目标作业被暂停时，那些已经分配并运行任务容器的作业将继续运行，直到完成或通过其他方式激活抢占 。但是不会再为目标工作分配新的容器。

相反，当暂停的作业进入恢复模式时，它们将继续从先前的作业进度运行并分配新的任务容器以完成其余的作业。

答案 1 :(得分：0)

据我所知，Datanode从客户端进程接收数据的过程（谁请求在HDFS中存储一些数据）并存储它。然后，此Datanode将完全相同的数据转发到另一个Datanode（以实现复制），依此类推。复制完成后，确认将返回到Namenode，后者将最终通知客户端写入请求的完成情况。

基于上述流程，为了服务第二个客户端的写请求（让我们假设第二个客户端具有更高的优先级），暂停HDFS写操作是不可能的，因为如果我们暂停Datanode本身它将对想要在其上写入的每个人保持暂停状态，因此HDFS的这部分将保持被阻止。最后，如果我从JobController类函数暂停一个作业，我实际上暂停了客户端的进程（如果我真的设法在他的请求完成之前捕获它）。如果我错了，请纠正我。