我正在尝试在Keras中实现Google宽和深度模型。
根据原始论文和官方TF实施,优化是由两个优化器并行完成的。 https://github.com/tensorflow/tensorflow/blob/master/tensorflow/contrib/learn/python/learn/estimators/dnn_linear_combined.py#L328
可以通过诸如{branch1:“ optimizer1”,branch2:“ optimizer2”}之类的优化器字典来编译模型,并且可以分别计算损失。 提前致谢。