Question

我正在尝试实施用于半监督学习的PI模型在[1]中介绍。

要计算损失函数，两个正向通过网络需要相同的数据，从而在每次正向传递中使用数据进行修改随机扩张。另外，使用了丢失，并且在两次通过中的每一次应该放弃不同的神经元选择。

我不太确定如何实现所需的丢失机制。

当我将两个不同的增强批次连接为我的网络的输入时，这样一个批次现在包含两种不同的数据增强。是否有可能添加两个＆＃34; parallel＆＃34;需要丢失层的tf.nn.dropout个图层，并以某种方式为前半部分定义第一个应该使用批次，第二个应该使用第二个批次？然后再次拆分网络的输出应该给出结果两个＆＃34;分开＆＃34;运行。

另一种方法是真正使用两个单独的session.run来电，有两种不同的数据增强。但是，我不太确定然后我可以如何正确执行渐变更新。

[1] https://arxiv.org/abs/1610.02242

Answer 1

您可以使用tf.split()将批处理分成两半，分别通过tf.layers.dropout()提取每一半，然后使用tf.concat()重新连接它们。像这样的东西（伪代码）：

splitted = tf.split( batch, 2, axis = 0 )
first_half = tf.dropout( splitted[ 0 ], rate = 0.5 )
second_half = tf.dropout( splitted[ 1 ], rate = 0.6 ) 
rejoined = tf.concatenate( [ first_half, second_half ], axis = 0 )

Tensorflow针对一个渐变更新的不同丢失配置

1 个答案: