CNTK ImageDeserializer和DCGAN示例

时间:2017-05-15 23:49:32

标签: cntk dcgan

我正在重新处理此示例https://github.com/Microsoft/CNTK/blob/master/Tutorials/CNTK_206B_DCGAN.ipynb以使用png MNIST文件(而不是教程使用的平面1d数组图像输入)。我使用ImageDeserializer(和映射文件来加载数据):

def create_mb_source(map_file, image_dims, num_classes, randomize=True):
transforms = [
    xforms.scale(width=image_dims[2], height=image_dims[1], channels=image_dims[0], interpolations='linear')]
return MinibatchSource(ImageDeserializer(map_file, StreamDefs(
    features=StreamDef(field='image', transforms=transforms),
    labels=StreamDef(field='label', shape=num_classes))),
                       randomize=randomize)

我将Discriminator的输入输出更改为28x28图像(和Generator的输出)。请参阅此处的代码:https://github.com/olgaliak/cntk-cyclegan/blob/master/trainDCGan.py

问题是trainDCGan.py现在正在产生噪音。感谢您的帮助!

1 个答案:

答案 0 :(得分:1)

一旦我解决了这个问题 1)在ImageDeserializer中切换到使用过的3个通道 2)改变网络架构使用2d strides \ kernels而不是1d。 This commit突出了使事情有效的变化。