张量流对象检测是否支持分发策略?

时间:2018-12-05 08:00:18

标签: tensorflow object-detection-api

系统信息

  • 您正在使用的模型的顶级目录是什么:对象检测
  • 我是否编写了自定义代码(与使用TensorFlow中提供的股票示例脚本相对):否
  • OS平台和发行版(例如Linux Ubuntu 16.04):Centos 7.5
  • 从(源或二进制):源
  • 安装的TensorFlow
  • TensorFlow版本(使用下面的命令):1.9.0
  • Bazel版本(如果从源代码编译):0.19
  • CUDA / cuDNN版本:9.0
  • GPU模型和内存:Titan 1080 Ti / 8G
  • 要复制的精确命令:否
  • 分布式环境:2台机器,每个机器有8个GPU

描述问题

我想进行有关对象检测的分布式培训。 首先,我通过简单地在命令中设置'TF_CONFIG'来运行文件'model_main.py',它可以平稳运行。这是进行分布式培训的正确方法吗? 但是这种方式似乎是异步培训。 为了进行同步训练,我将{RunConfig“配置为打击,如Distribution Strategy所述:

config = tf.estimator.RunConfig(train_distribute=tf.contrib.distribute.CollectiveAllReduceStrategy())

报告:

  

AttributeError:“模块”对象没有属性“ CollectiveAllReduceStrategy”。

tensorflow对象检测是否支持分发策略? 如果是,是否使用分发策略有什么区别? 如果没有,还有其他方法可以进行同步培训吗?

1 个答案:

答案 0 :(得分:1)

您应该更新tensorflow版本> = 1.11