我有一个LSTM网络,该网络通过tf.tanh
输出一个决定。然后,我使用tf.sign
来获取1,-1或0的二进制动作。但是,我不希望模型在tf.tanh
的输出较小时做出非零动作,所以我想要在T
之前实现阈值tf.sign
,以便仅将大于T或小于-T的输出转换为+1和-1。
tf.tanh
的张量输出示例:
logits = [0.6,0.4,-0.6,-0.4]
threshold = 0.5
在保留梯度的同时所需的张量输出:
action = [1,0,-1,0]
这有点像带有阈值的双面ReLU,但我不知道如何在tensorflow图中进行操作。任何帮助表示赞赏。
答案 0 :(得分:1)
这对我有用。如果查看变量名,该代码将很容易解释。让我知道是否不清楚。
checkout