应用错误收集

时间：2019-01-02 11:51:23

标签： tensorflow

我正在研究分布式DNN，据我所知，我们可以在许多GPU上分布DNN计算，也可以在移动设备上进行。推理架构通常是单个平台，因此可以存在于移动平台或云平台中。

我的问题是：

我们可以在联合平台（云和移动平台）中分配DNN架构中的训练和推理阶段吗？如果可能的话，该怎么做？

答案 0 :(得分：-1)

根据您的框架，有很多选择。 Horovod在很大程度上与框架无关，可用于分布式培训。它还满足您使用云服务的需求。尽管使用Distributed Tensorflow创建自己的框架是完全可能的，但是您应该意识到，这是比Horovod更为底层的方法，因此缺少一些麻烦。

另一方面，分布式推理并不常见，因为推理本身不需要像训练那样的计算能力，并且在大多数情况下是embarassingly parallelizable。