如何重新启动Service Fabric标尺设置计算机

时间:2018-10-04 12:22:06

标签: azure-service-fabric

我们有一个服务矩阵集群,其中一个规模集(主要)有5个节点。我们的一项服务出现内存泄漏,耗尽了节点上的所有可用内存,最终其他服务失败。例如,某些Powershell命令现在无法使用。在Service Fabric资源管理器中,一切正常,并且没有任何错误或警告。是否可以重新启动计算机?什么是最好的重启方法,以便我们可以将计算机恢复到所有服务都在工作的初始状态?

在缩放比例集中设置时,它将删除索引最高的节点,因此按照文档进行操作,放大然后再删除有故障的节点将无济于事。

如果我们重新启动比例集节点,买一买怎么办?我看到服务结构可以处理它-禁用节点,然后再激活它。但是从银色层的文档中,我们需要一直保持5个节点正常运行。因此,在重启任何节点之前,我们应该扩大规模,再添加一个节点,然后继续重启吗?

1 个答案:

答案 0 :(得分:1)

如果出现故障的节点仍在运行正常的服务,最好的方法是先使用Disable-ServiceFabricNode命令禁用该节点,以便将所有正常的服务移出节点,而影响较小。

在某些情况下,一旦移动了服务,仅执行Restart-ServiceFabricNode命令就可以杀死所有锁定的服务并恢复正常运行,而无需实际重新启动VM。

在最后一种情况下,您可能需要通过Powershell或Azure门户重新启动VM,以重新启动节点。

如果集群在高密度负载上运行,则可能需要先进行扩展以为集群带来容量以重新分配服务。