我正在尝试实施"深度卷积反向图形网络"使用tensorflow,这意味着我必须对渐变做一些棘手的事情。
基本上,我想将自动编码器分成两个独立的网络。我没有必要,但那会很方便。目的是对在反向传播步骤期间流动的梯度应用一些不可表达的修改。你有什么想法可以做到吗?这是我想要实现的模式:
很容易看出,对于前进路径,它意味着接收一个网络的输出并将其插入另一个网络。不幸的是,我无法看到如何反向传播错误。
此刻我最好的想法是复制一个权重矩阵,即将W3复制到编码器为W2.5,而将W3的复制梯度复制为W2.5的梯度。但是在这个模式中必须有一个更简单的方法或明显的误解。