不活动后自动“停止” Sagemaker笔记本实例?

时间:2018-12-04 09:18:11

标签: amazon-web-services aws-lambda amazon-cloudwatch amazon-sagemaker

我有一个Sagemaker Jupyter笔记本实例,我错误地使自己整夜上网,这不必要地花了钱...

在没有活动(例如1个小时)的情况下,是否可以自动停止Sagemaker笔记本实例?还是我必须制作一个自定义脚本?

4 个答案:

答案 0 :(得分:4)

您可以使用Lifecycle configurations设置自动作业,该作业将在不活动后停止实例。

a GitHub repository,其中包含您可以使用的示例。在存储库中,有一个auto-stop-idle脚本,一旦实例闲置1小时以上,它将关闭您的实例。

您需要做的是

  1. 使用脚本创建生命周期配置,然后
  2. 将配置与实例相关联。您可以在编辑或创建Notebook实例时执行此操作。

如果您认为1小时太长,可以调整脚本。 This line具有值。

答案 1 :(得分:1)

在我们由于忘记关闭这些机器而花了很多钱之后,我决定创建一个脚本。它基于AWS' script,但提供了解释为什么机器被杀死或未被杀死的原因。它非常轻巧,因为它不使用任何其他基础设施,例如Lambda。

这里是scriptguide on installing it!这只是一个简单的生命周期配置!

答案 2 :(得分:0)

不幸的是,今天在SageMaker中没有活动时无法自动停止Notebook实例。为了避免将它们留在一夜之间,您可以编写cron作业以检查夜间是否有任何正在运行的Notebook实例,并在需要时停止它们。

答案 3 :(得分:0)

您还可以使用CloudWatch + Lambda监视Sagemaker,并在利用率达到最低时停止。这是CW中可用于SM的列表:https://docs.aws.amazon.com/sagemaker/latest/dg/monitoring-cloudwatch.html

例如,您可以将CW警报设置为在30分钟内CPU使用率降至5%以下时触发,并触发Lambda从而关闭笔记本电脑。