气流ML引擎Package_URI

时间:2019-01-28 12:22:52

标签: airflow google-cloud-ml google-cloud-composer

URI包的用途是什么?它是强制性的吗?如果是这样,我该如何创建一个? 目前,我已将模型包装转换为以下正确格式:

model.py
task.py
_init_.py

2 个答案:

答案 0 :(得分:0)

我假设您是在询问MLEngineTrainingOperator中的package_uris。

关于它的说明可以在Cloud ML Engine Documentations中找到。 一件不同之处是,与使用gcloud时不同,对于Airflow集成而言,由于Airflow操作员正在远程运行并且无法从本地目录进行打包,因此您需要自己提供/包装一个软件包。

您可能需要的是基于setuptools的setup.py,具有适当的依赖性。 (顺便说一下,_init_.py是无效文件,__init__.py是。) 目录就绪后,您只需运行以下命令即可上载软件包。

python setup.py sdist 
gsutil cp dist/<tarfile> gs://<your_bucket>/<folder>/

或者,如果您已经有使用gcloud ml-engine jobs submit training命令上传的软件包,则只​​需提供uri即可重复使用。

答案 1 :(得分:0)

我能够manually build the package并将其放置在Cloud Composer存储桶中。然后,我提供了存储桶中文件的路径:

package_uris=["gs://us-central1-ml-engine/trainer-0.1.tar.gz"]