TensorFlow教程的Cloud ML引擎没有在本地运行的名为训练器的模块

时间:2018-11-19 15:50:17

标签: python tensorflow google-cloud-platform google-cloud-ml

Tutorial I am following

一直在尝试遵循Google教程以将ML Engine用于TensorFlow。出现错误

时被卡在说“进行本地培训工作”的地方
/usr/bin/python: No module named trainer

完整命令是:

gcloud ml-engine local train \
    --module-name trainer.task \
    --package-path trainer/ \
    --job-dir $MODEL_DIR \
    -- \
    --train-files $TRAIN_DATA \
    --eval-files $EVAL_DATA \
    --train-steps 1000 \
    --eval-steps 100

据我所知,这三个变量都已正确设置,尽管现在甚至都没有。本教程未指定下载培训师文件或如何对其进行引用,过去一个小时的谷歌搜索并没有提供任何有效的解决方案。找到了以下一般解释:

  

-module-name指定应用程序主模块的名称,   使用包的名称空间点表示法。这是Python文件   运行以启动应用程序。例如,如果您的主   模块是... / my_application / trainer / task.py(请参阅   项目结构),则模块名称为trainer.task

任何信息将不胜感激。

1 个答案:

答案 0 :(得分:0)

感谢达斯汀在评论中提供的信息,找到了解决方案。

只需在Cloud Shell而不是我的本地环境上下载Trainer目录。

现在文件结构如下:

estimator
    |-- data
    |   |-- adult_data.csv
    |   |-- adult_test.csv
    |-- output
    |-- trainer
    |   |-- __init__.py
    |   |-- model.py
    |   |-- task.ipynb
    |   |-- task.py