AWS SageMaker最低配置

时间:2018-05-12 04:20:35

标签: scikit-learn amazon-sagemaker

为什么我需要AWS SageMaker的容器?如果我想在SageMaker的Jupyter笔记本上运行Scikit Learn用于自学习目的,我还需要为它配置容器吗?

如果我只是想学习Scikit Learn,我需要SageMaker的最低配置是什么?例如,我想运行Scikit Learn的决策树算法,其中包含一组训练数据和一组测试数据。我需要在SageMaker上执行哪些任务才能执行此操作?感谢。

2 个答案:

答案 0 :(得分:3)

你不需要太多。只是一个具有您角色相关权限的AWS账户。 在AWS SageMaker控制台内,您只需单击一下即可运行AWS Notebook实例。有预装的Sklearn,你可以开箱即用。不需要特殊的容器。

您至少需要具有相关权限的AWS账户才能创建EC2实例并从S3读取/写入。多数民众赞成,试试吧。 :)

以此为出发点:Amazon SageMaker – Accelerating Machine Learning

You can also access it via the Jupyter Terminal

答案 1 :(得分:0)

如果您不担心使用Sagemaker的培训和部署功能,则只需创建一个新的conda_python3笔记本并导入sklearn。

我也对如何利用Scikit Learn充分利用Sagemaker的火车/部署功能感到困惑。最好的解释和最新的似乎是:

https://github.com/aws/sagemaker-python-sdk/blob/master/src/sagemaker/sklearn/README.rst

简要摘要是:

  1. 您将训练数据保存到S3存储桶中。
  2. 创建一个独立的python脚本来进行训练,将训练模型序列化为文件并将其保存到S3存储桶中。
  3. 在Sagemaker上的笔记本中,您导入Sagemaker SDK,并将其指向您的训练脚本和数据。然后,Sagemaker将临时创建一个AWS实例来训练模型。
  4. 一旦训练该实例会自动销毁。
  5. 最后,您使用Sagemaker SDK将经过训练的模型部署到另一个AWS实例。这还会自动创建一个可以调用以进行预测的端点。