尝试为Tensorflow对象检测任务提交Google Cloud ML培训作业,我正在关注official guideline
以下是我提交的工作:
export CONFIG=trainer/cloud.yaml
export TRAIN_DIR=kt-1000/training
export PIPELINE_CONFIG=kt-1000/training/ssd_mobilenet_v1_pets.config
gcloud ml-engine jobs submit training object_detection_`date +%s` \
--job-dir=gs://${TRAIN_DIR} \
--packages dist/object_detection-0.1.tar.gz,slim/dist/slim
0.1.tar.gz \
--module-name object_detection.train \
--region asia-east1-a \
--config ${CONFIG} \
-- \
--train_dir=gs://${TRAIN_DIR} \
--pipeline_config_path=gs://${PIPELINE_CONFIG}
我收到以下错误消息:
ERROR: (gcloud.ml-engine.jobs.submit.training) unrecognized arguments:
然而,错误消息并未指出哪个参数无法识别!!!!
对此的任何帮助都将非常感激
谢谢,
Devjothi
答案 0 :(得分:2)
您只需要删除--
之前的所有空格,就像这样:
gcloud ml-engine jobs submit training $JOB_NAME \
--job-dir $OUTPUT_PATH \
--runtime-version 1.10 \
--python-version 3.5 \
--module-name trainer.task \
--package-path trainer/ \
--region $REGION \
-- \
--train-files $TRAIN_DATA \
--eval-files $EVAL_DATA \
--train-steps 1000 \
--eval-steps 100 \
--verbosity DEBUG
答案 1 :(得分:1)
我在Windows机器上的官方指南中也遇到了这些问题。
1.检查无法识别的论点是什么。
2. --config
和--train_dir
之间有一个空的--
(这是我的错误来自)
ps:在Windows上没有date +%s
。因此,我替换为我自己的JOB_NAME。
答案 2 :(得分:0)
尝试没有工作目录。你不需要指定job-dir。 ML Engine会在调用您的工作时传递工作目录
答案 3 :(得分:0)
就我而言,我添加了以下内容
import gcsfs
然后可以识别$变量。