标签: tensorflow
我的深度学习算法基于Wide&Deep模型,并且FtrlOptimizer优化了宽部分(完全嵌入),而Adam则优化了深部分。通过时间轴,我发现FtrlOpitmizer完全可以在CPU上工作。阅读代码后,我发现SparseApplyFtrl方法仅在CPU上有效。我想知道tensorflow优化器如何选择稀疏和密集部分,为什么在我的代码中它使用SparseApplyFtrl并仅在CPU上进行计算。 这是时间线图: