我在tensorflow中使用tf.Adamoptmizer时遇到了麻烦。
这是代码:
dis_diff = base_discriminator(interpolates, self.num_planes, reuse=True,
scope=self.scope, only_gan=True)
gradients = tf.gradients(dis_diff, interpolates)[0]
#this code run for an hour
train_op=tf.train.AdamOptimizer(1e-6).minimize(tf.reduce_mean(gradients))
base_discriminator是resnet-50。运行最新句子大约需要1小时。代码来自wgan-gp。 我用错了吗?