与CNTK和numpy interop的并行训练

时间:2017-04-07 10:10:10

标签: python cntk

我正在训练一个自动编码器网络,每个训练样本需要读取三个图像(一个输入RGB图像,两个输出RGB图像)。很容易使用python和numpy interop并在我自己阅读图像文件。

如何使用此功能启用并行/分布式培训?我是否必须使用培训课程构建?我是否必须使用图像阅读器minibatch源?

2 个答案:

答案 0 :(得分:1)

有以下选项: 1)使用分布式学习器+训练课程 - 然后你需要使用ImageDeserializer,或者实现你自己的MinibatchSource(这种可扩展性仅在RC2开始时可用) 2)使用分布式学习器+自己编写训练循环。在这种情况下,您必须注意分割数据(每个工作人员应该只读取与其等级相对应的图像),并且循环内的所有条件应基于trainer-> TotalNumberOfSamples()(即,如果您执行任何操作,则检查点)

答案 1 :(得分:0)

您是否已查看以下链接,了解如何使用mpiexec并行化多台计算机上的培训?

https://github.com/Microsoft/CNTK/wiki/Multiple-GPUs-and-machines#32-python