我看到YouTube发布的这篇研究论文,关于他们如何使用深度学习神经网络提出建议。它位于:https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45530.pdf
在本文中,候选生成神经网络模型输出具有256维的softmax,其作为"输出嵌入"每个1M视频类。
例如,如何在Tensorflow中实现这一点? Isn< softmax应该只是1维。如果模型输出"嵌入"像这样,正如他们所说的那样,训练数据的标签将如何被格式化为256维?换句话说,他们如何计算训练数据集中每个视频的256维向量?
此外,当训练数据集中的标签是特定类的单热编码时,是否可以创建输出嵌入层。换句话说,输出层可以自动学习输出类的嵌入吗?
非常感谢您的时间和帮助,伙计们!
更新 本文的第4部分第3.5节(前几行)
讨论了这一部分