如果我将TensorFlow培训作业发送到SageMaker实例,查看培训进度的典型方法是什么?我可以访问这个已启动的EC2实例的TensorBoard吗?还有其他选择吗?我正在专门寻找的是诸如当前训练时期和mAP的图表之类的东西。
答案 0 :(得分:3)
您现在可以使用AWS管理控制台或Amazon SageMaker Python SDK API指定要跟踪的指标(metricName,Regex)。在模型训练开始之后,Amazon SageMaker将自动实时监视指定指标并将其流式传输到Amazon CloudWatch控制台,以可视化时间序列曲线。
参考: https://docs.aws.amazon.com/sagemaker/latest/dg/API_MetricDefinition.html