为Tensorflow对象检测提交Google Cloud ML培训作业时出现错误消息

时间:2017-10-29 13:11:39

标签: tensorflow google-cloud-ml

尝试为Tensorflow对象检测任务提交Google Cloud ML培训作业,我正在关注official guideline

以下是我提交的工作:

export CONFIG=trainer/cloud.yaml
export TRAIN_DIR=kt-1000/training
export PIPELINE_CONFIG=kt-1000/training/ssd_mobilenet_v1_pets.config

gcloud ml-engine jobs submit training object_detection_`date +%s` \

    --job-dir=gs://${TRAIN_DIR} \
    --packages dist/object_detection-0.1.tar.gz,slim/dist/slim
0.1.tar.gz \
    --module-name object_detection.train \
    --region asia-east1-a \
    --config ${CONFIG} \
    -- \
    --train_dir=gs://${TRAIN_DIR} \
    --pipeline_config_path=gs://${PIPELINE_CONFIG}

我收到以下错误消息:

ERROR: (gcloud.ml-engine.jobs.submit.training) unrecognized arguments:

然而,错误消息并未指出哪个参数无法识别!!!!

对此的任何帮助都将非常感激

谢谢,

Devjothi

4 个答案:

答案 0 :(得分:2)

您只需要删除--之前的所有空格,就像这样:

gcloud ml-engine jobs submit training $JOB_NAME \
--job-dir $OUTPUT_PATH \
--runtime-version 1.10  \
--python-version 3.5 \
--module-name trainer.task \
--package-path trainer/ \
--region $REGION \
-- \
--train-files $TRAIN_DATA \
--eval-files $EVAL_DATA \
--train-steps 1000 \
--eval-steps 100 \
--verbosity DEBUG

答案 1 :(得分:1)

我在Windows机器上的官方指南中也遇到了这些问题。

1.检查无法识别的论点是什么。

2. --config--train_dir之间有一个空的--(这是我的错误来自)

ps:在Windows上没有date +%s。因此,我替换为我自己的JOB_NAME。

答案 2 :(得分:0)

尝试没有工作目录。你不需要指定job-dir。 ML Engine会在调用您的工作时传递工作目录

答案 3 :(得分:0)

就我而言,我添加了以下内容

import gcsfs

然后可以识别$变量。