Sagemaker内存泄漏

时间:2018-09-28 06:32:10

标签: amazon-sagemaker

我在sagemaker中部署了一个深度学习模型,并创建了一个端点。 不幸的是,我将其放置为大尺寸图像,然后端点返回“ RuntimeError:CUDA错误:内存不足”。 因此,我想重新启动端点,但似乎没有任何重新启动按钮。 重新启动该怎么办?

谢谢

1 个答案:

答案 0 :(得分:1)

假设您用“重新启动”来表示UpdateEndpoint,那么如果SageMaker端点已经处于“失败”状态,则将无法对其进行更新。 SageMaker API references中对此进行了记录。

如果已经确定了端点故障的原因,则可以删除发生故障的端点,并使用正确的模型创建一个新的端点。