Tensorflow - 检查点未保存到Sagemaker Notebook实例

时间:2018-01-31 10:13:03

标签: python python-3.x amazon-web-services tensorflow amazon-sagemaker

我在Amazon Sagemaker笔记本实例中使用Tensorflow运行Python脚本。我可以正常地写入笔记本中的存储空间,但由于某种原因,我在尝试保存Tensorflow模型检查点时失败了。此代码之前在移植到Sagemaker之前已经有效。

以下是我的代码的简化版本:

bucket = 'sagemaker-complaints-data'    
prefix = 'DeepTestV2' # place to upload training files within the bucket
timestamp = str(int(time()))
out_dir = os.path.abspath(os.path.join(bucket, prefix, "runs", timestamp))
checkpoint_dir = os.path.abspath(os.path.join(out_dir, "checkpoints"))
checkpoint_prefix = os.path.join(checkpoint_dir, "model")
path = saver.save(sess, checkpoint_prefix, global_step=current_step)
print("Saved model checkpoint to {}\n".format(path))

没有抛出任何错误,print语句正在输出正确的路径。我已经研究过在Sagemaker中使用检查点是否存在任何已知问题,但实际上没有任何帖子描述这一点。

1 个答案:

答案 0 :(得分:1)

我发现了这个地方 - 出于某种原因"检查站"似乎是一个保守的词 - 将单词改为"检查"允许我写文件夹。希望这有助于某人!