如何保存在Amazon SageMaker中本地训练的模型?

时间:2020-07-28 16:36:57

标签: amazon-sagemaker

我正在尝试在SageMaker中使用本地培训工作。

跟随这个AWS笔记本(https://github.com/awslabs/amazon-sagemaker-examples/blob/master/sagemaker-python-sdk/mxnet_gluon_mnist/mxnet_mnist_with_gluon_local_mode.ipynb),我能够在本地进行培训和预测。

是否可以在Amazon SageMaker培训工作部分中进行本地培训并保存经过培训的模型? 否则,如何正确保存使用本地模式训练的训练模型?

2 个答案:

答案 0 :(得分:1)

无法将本地模式培训作业显示在AWS控制台中。本地模式的目的是允许在使用SageMaker训练模型之前进行更快的迭代/调试。

您可以从本地模型工件创建SageMaker模型。将模型工件压缩到.tar.gz文件中,将该文件上传到S3,然后创建模型(使用SDK或在控制台中)。

文档:

答案 1 :(得分:1)

正如@lauren所说,只需将其压缩并创建模型。在对它进行本地培训后,您就不必将其另存为培训工作,因为您已经拥有了模型的工件。

训练作业是input_location,output_location,选择的算法和超参数的组合。那就是保存在训练工作上的东西,而不是训练有素的模型。培训工作完成后,实际上会压缩工件并将模型保存在Amazon S3中,以便您可以从中创建模型。

因此,由于您是在本地进行训练的(而不是将训练步骤解耦),所以请使用压缩的工件创建一个模型,然后创建一个端点并进行一些推断。