我有一个Sagemaker Jupyter笔记本实例,我错误地使自己整夜上网,这不必要地花了钱...
在没有活动(例如1个小时)的情况下,是否可以自动停止Sagemaker笔记本实例?还是我必须制作一个自定义脚本?
答案 0 :(得分:4)
您可以使用Lifecycle configurations设置自动作业,该作业将在不活动后停止实例。
有a GitHub repository,其中包含您可以使用的示例。在存储库中,有一个auto-stop-idle脚本,一旦实例闲置1小时以上,它将关闭您的实例。
您需要做的是
如果您认为1小时太长,可以调整脚本。 This line具有值。
答案 1 :(得分:1)
在我们由于忘记关闭这些机器而花了很多钱之后,我决定创建一个脚本。它基于AWS' script,但提供了解释为什么机器被杀死或未被杀死的原因。它非常轻巧,因为它不使用任何其他基础设施,例如Lambda。
这里是script和guide on installing it!这只是一个简单的生命周期配置!
答案 2 :(得分:0)
不幸的是,今天在SageMaker中没有活动时无法自动停止Notebook实例。为了避免将它们留在一夜之间,您可以编写cron作业以检查夜间是否有任何正在运行的Notebook实例,并在需要时停止它们。
答案 3 :(得分:0)
您还可以使用CloudWatch + Lambda监视Sagemaker,并在利用率达到最低时停止。这是CW中可用于SM的列表:https://docs.aws.amazon.com/sagemaker/latest/dg/monitoring-cloudwatch.html。
例如,您可以将CW警报设置为在30分钟内CPU使用率降至5%以下时触发,并触发Lambda从而关闭笔记本电脑。