智者的持续培训

时间:2018-06-22 07:58:32

标签: amazon-sagemaker

我正在尝试 Amazon Sagemaker ,但我还没有弄清楚如何进行持续培训。
例如,如果我在s3中有一个CSV文件,并且每次更新CSV文件时都想训练。

我知道我们可以再次进入笔记本电脑,然后重新运行整个笔记本电脑以实现此目的。
但是我正在寻找一种自动化的方式,使用一些python脚本或将lambda函数与s3事件等配合使用

2 个答案:

答案 0 :(得分:2)

您可以使用boto3 sdk for python开始对lambda进行训练,然后在csv更新时需要触发lambda。

  

http://boto3.readthedocs.io/en/latest/reference/services/sagemaker.html

示例python代码

  

https://docs.aws.amazon.com/sagemaker/latest/dg/ex1-train-model-create-training-job.html

添加:您不需要使用lambda,您只需启动/克隆python脚本的任何实例即可,其中包含python和aws sdk。

答案 1 :(得分:2)

aws-samples GitHub上有几个示例来说明如何实现这一点。

serverless-sagemaker-orchestration示例听起来与您描述的用例最相似。本示例向您介绍如何持续训练SageMaker线性回归模型,以使用内置的LinearLearner算法(由Amazon CloudWatch Events精心安排,每天将新的CSV数据添加到S3存储桶中,对新的CSV数据进行房价预测), AWS Step FunctionsAWS Lambda

也有类似的aws-sagemaker-build示例,但是如果您要查找详细说明,可能目前很难遵循。

希望这会有所帮助!