我正在尝试 Amazon Sagemaker ,但我还没有弄清楚如何进行持续培训。
例如,如果我在s3中有一个CSV文件,并且每次更新CSV文件时都想训练。
我知道我们可以再次进入笔记本电脑,然后重新运行整个笔记本电脑以实现此目的。
但是我正在寻找一种自动化的方式,使用一些python脚本或将lambda函数与s3事件等配合使用
答案 0 :(得分:2)
您可以使用boto3 sdk for python开始对lambda进行训练,然后在csv更新时需要触发lambda。
http://boto3.readthedocs.io/en/latest/reference/services/sagemaker.html
示例python代码
https://docs.aws.amazon.com/sagemaker/latest/dg/ex1-train-model-create-training-job.html
添加:您不需要使用lambda,您只需启动/克隆python脚本的任何实例即可,其中包含python和aws sdk。
答案 1 :(得分:2)
在aws-samples GitHub上有几个示例来说明如何实现这一点。
serverless-sagemaker-orchestration示例听起来与您描述的用例最相似。本示例向您介绍如何持续训练SageMaker线性回归模型,以使用内置的LinearLearner算法(由Amazon CloudWatch Events精心安排,每天将新的CSV数据添加到S3存储桶中,对新的CSV数据进行房价预测), AWS Step Functions和AWS Lambda。
也有类似的aws-sagemaker-build示例,但是如果您要查找详细说明,可能目前很难遵循。
希望这会有所帮助!