应用错误收集

张量流对象检测是否支持分发策略？

时间：2018-12-05 08:00:18

标签： tensorflow object-detection-api

系统信息

您正在使用的模型的顶级目录是什么：对象检测
我是否编写了自定义代码（与使用TensorFlow中提供的股票示例脚本相对）：否
OS平台和发行版（例如Linux Ubuntu 16.04）：Centos 7.5
从（源或二进制）：源
TensorFlow版本（使用下面的命令）：1.9.0
Bazel版本（如果从源代码编译）：0.19
CUDA / cuDNN版本：9.0
GPU模型和内存：Titan 1080 Ti / 8G
要复制的精确命令：否
分布式环境：2台机器，每个机器有8个GPU

描述问题

我想进行有关对象检测的分布式培训。首先，我通过简单地在命令中设置'TF_CONFIG'来运行文件'model_main.py'，它可以平稳运行。这是进行分布式培训的正确方法吗？但是这种方式似乎是异步培训。为了进行同步训练，我将{RunConfig“配置为打击，如Distribution Strategy所述：

config = tf.estimator.RunConfig(train_distribute=tf.contrib.distribute.CollectiveAllReduceStrategy())

报告：

AttributeError：“模块”对象没有属性“ CollectiveAllReduceStrategy”。

tensorflow对象检测是否支持分发策略？如果是，是否使用分发策略有什么区别？如果没有，还有其他方法可以进行同步培训吗？

1 个答案:

答案 0 :(得分：1)

您应该更新tensorflow版本> = 1.11