使用gcloudml-examples模板我创建了一个新模型。 使用命令行在gcloud shell中运行本地
gcloud ml-engine local train --module-name=trainer.task --package-
path=./trainer -- --train-files="gs://bucket-
ml/data/treinamento/train/part
*.csv" --eval-files="gs://bucket-ml/data/treinamento/test/part*.csv"
-- job-dir="gs://bucket-ml/data/treinamento/modelo"
一切正常.GCloud-ml在..treinamento / modelo创建了几个检查点,并在其中创建了一个带有savedModel的文件夹
问题是当我用
提交给gcloud时gcloud ml-engine jobs submit training "JobName123" \
--job-dir "gs://bucket-ml/data/export" \
--packages="gs://bucket-ml/modelo/trainer-0.1.tar.gz"\
--module-name="trainer.task"\
--scale-tier=BASIC \
--region us-east1 \
-- --train-files="gs://bucket-ml/data/treinamento/train/part*.csv"\
--eval-files="gs://bucket-ml/data/treinamento/test/part*.csv"\
--verbosity="DEBUG"
gcloud-ml读取列车和eval文件,创建检查点就像本地模式一样,但不创建文件夹和savedModel
并以无错误结束。 代码完全一样。只需使用python setup.py sdis打包培训师。有人可以帮帮我吗?
答案 0 :(得分:0)
您可以像this文档中提供的示例一样使用'package-path',而不是使用'packages'。此外,监控Stackdriver日志中的任何警告或错误以及training jobs,它们可能会提供更多信息。