Azure批量抢占状态

时间:2018-10-25 20:56:18

标签: azure azure-batch

我有一个在Azure批处理下运行的TVM /池,突然进入了“抢占”状态。现在的问题是,它现在不接受任何请求。

我还设置了比例公式,其中每当我有超过0个待处理的作业要在Azure批处理中执行时,该公式就会为我提供VM。但显然这也不起作用。 TVM进入抢占状态之前,它已经在工作。

如何处理这些情况?

1 个答案:

答案 0 :(得分:2)

  • AFAIK,我认为是低优先级的节点可以根据可用容量进入“ 抢占”状态。因此,低优先级的VM最适合某些类型的工作负载。将低优先级VM用于批处理和异步处理工作负载,这些工作的完成时间很灵活,并且工作分散在许多VM中。这就是此处定义的行为:https://docs.microsoft.com/en-us/azure/batch/batch-low-pri-vms

  • 我认为问题的后半部分也与您的虚拟机已被抢占这一事实有关。

  

鉴于低优先级VM的特性,哪些工作负载可以使用或不能使用它们?通常,批处理工作负载非常合适,因为作业可以分解为许多并行任务,或者有许多作业可以横向扩展并分布在许多VM中。

     

为最大限度地利用Azure中的剩余容量,可以扩展合适的工作。

     

有时,VM可能不可用或被抢占,这会导致作业容量减少,并可能导致任务中断和重新运行。因此,作业在运行时间上必须具有灵活性。

     

任务较长的工作如果受到干扰,可能会受到更大的影响。如果长时间运行的任务执行检查点以在执行时保存进度,则可以减少中断的影响。执行时间较短的任务通常在优先级较低的VM上效果最佳,因为中断的影响要小得多。

     

使用多个VM的长时间运行的MPI作业不适合使用低优先级的VM,因为一个被抢占的VM可能导致整个作业不得不再次运行。

希望有帮助。