应用错误收集

当使用Tensorflow开始实现随机深度regularization approch时，我遇到了一个问题。论文（https://arxiv.org/pdf/1603.09382.pdf）指出，如果我们在训练期间随机随机某些剩余单位，模型可以更快地收敛。 Current Torch实现完美无缺。在Tensoflow中，我可以在剩余单位分支上设置条件，这样在前进步骤期间，它的激活将被取消，但权重仍将在后退步骤中更新。没有办法告诉我们这些权重（在我们取消的剩余分支中）不再可训练，并且它们不应包含在当前会话运行的优化中。

我已经在github上创建了issue，在那里我介绍了如何以天真的方式解决这个问题，当然有些东西会阻止应用一个简单的修复，否则真的很奇怪为什么tf.Variable的 trainable 参数不允许布尔Tensor作为值。如果有人对这个问题有所了解，如果你恢复对Tensoflow的信心，我将非常感激：）

Tensorflow。有条件的可训练变量和随机深度神经网络

1 个答案: