我在sagemaker中部署了一个深度学习模型,并创建了一个端点。 不幸的是,我将其放置为大尺寸图像,然后端点返回“ RuntimeError:CUDA错误:内存不足”。 因此,我想重新启动端点,但似乎没有任何重新启动按钮。 重新启动该怎么办?
谢谢
答案 0 :(得分:1)
假设您用“重新启动”来表示UpdateEndpoint,那么如果SageMaker端点已经处于“失败”状态,则将无法对其进行更新。 SageMaker API references中对此进行了记录。
如果已经确定了端点故障的原因,则可以删除发生故障的端点,并使用正确的模型创建一个新的端点。