在gcloud ml引擎上进行tensorflow训练时出错

时间:2017-10-11 14:01:14

标签: tensorflow google-cloud-ml-engine

我正在关注此ml-engine指南。我确实设置了gcloud并创建了vm。对于tensorflow,我使用Anaconda 3来创建我的python环境。我使用python=3.6创建了新环境。但是当我开火时

gcloud ml-engine local train --module-name trainer.task --package-path trainer -- --train-files c:\Anaconda3\mytensorflowcode\cloudml-samples-master\census\estimator\data\adult.data.csv --eval-files c:\Anaconda3\mytensorflowcode\cloudml-samples-master\census\estimator\data\adult.test.csv --train-steps 1000 --job-dir c:\Anaconda3\mytensorflowcode\cloudml-samples-master\census\estimator\output --eval-steps 100

我收到以下错误

Traceback (most recent call last):
File "D:\gcsdk174\google-cloud-sdk\platform\bundledpython\lib\runpy.py", line 174, in _run_module_as_main
"__main__", fname, loader, pkg_name)
File "D:\gcsdk174\google-cloud-sdk\platform\bundledpython\lib\runpy.py", line 72, in _run_code
exec code in run_globals
File "C:\Anaconda3\mytensorflowcode\cloudml-samples-master\census\estimator\trainer\task.py", line 4, in <module>
import model
File "trainer\model.py", line 20, in <module>
import tensorflow as tf
ImportError: No module named tensorflow

我可以根据指南使用pip install -r ../requirements.txt命令成功安装tensorflow。

有人可以指出,我做错了吗?

1 个答案:

答案 0 :(得分:1)

更新:现在应该使用最新版本的gcloud修复此问题。你可以尝试一下,看看它是否适合你?首先:
gcloud components update

正在发生的事情是gcloud(静默地)需要py2.7,这会导致导入错误。这是我们即将修复的错误。 (这对Windows来说尤其成问题,因为TF不支持Windows的2.7安装)。 我们会在修复时更新。

与此同时,最好的选择可能就是直接运行你的python脚本进行本地测试(除非你试图在本地测试分布式训练)。

如果您尝试在本地测试分布式培训,那么您最好的临时选项可能是使用Docker和TensorFlow docker container