标签: tensorflow tensorflow-estimator
我想写一个新颖的train_op来测试一种新的训练算法,而不使用任何梯度或损失,这有点像强盗中的UCB算法。如何定义这样的train_op以将其添加到我的自定义估算器中?
非常感谢您!