我在https://www.tensorflow.org/tutorials/eager/custom_training页遇到以下句子:
对于表示嵌入的变量,TensorFlow会稀疏 默认情况下进行更新,从而提高了计算和内存效率。
,完全不理解。请帮我解释一下!
答案 0 :(得分:0)
嵌入是从离散域到实数向量的映射。
仅图像具有形状为tf.Variable
的{{1}},其中[key, value]
是离散域的维(例如单词列表),key
是表示value
的向量(通常此向量是密钥的潜在表示)。
Tensorflow使用变量表示嵌入映射,它允许访问key
元素以使用key
获得相应的value
。
因此,tensorflow无需进行完整的嵌入(这是一个巨大的变量),而是只能访问该变量的tf.nn.embedding_lookup
元素(稀疏访问),效率更高。