一直在尝试遵循Google教程以将ML Engine用于TensorFlow。出现错误
时被卡在说“进行本地培训工作”的地方/usr/bin/python: No module named trainer
完整命令是:
gcloud ml-engine local train \
--module-name trainer.task \
--package-path trainer/ \
--job-dir $MODEL_DIR \
-- \
--train-files $TRAIN_DATA \
--eval-files $EVAL_DATA \
--train-steps 1000 \
--eval-steps 100
据我所知,这三个变量都已正确设置,尽管现在甚至都没有。本教程未指定下载培训师文件或如何对其进行引用,过去一个小时的谷歌搜索并没有提供任何有效的解决方案。找到了以下一般解释:
-module-name指定应用程序主模块的名称, 使用包的名称空间点表示法。这是Python文件 运行以启动应用程序。例如,如果您的主 模块是... / my_application / trainer / task.py(请参阅 项目结构),则模块名称为trainer.task
任何信息将不胜感激。
答案 0 :(得分:0)
感谢达斯汀在评论中提供的信息,找到了解决方案。
只需在Cloud Shell而不是我的本地环境上下载Trainer目录。
现在文件结构如下:
estimator
|-- data
| |-- adult_data.csv
| |-- adult_test.csv
|-- output
|-- trainer
| |-- __init__.py
| |-- model.py
| |-- task.ipynb
| |-- task.py