什么是embedding_column在tensorflow中做什么

时间:2018-03-11 18:51:26

标签: tensorflow machine-learning embedding

从文档中我可以看出,它正在使用嵌入矩阵将稀疏输入向量等单热编码转换为密集向量。但这与仅使用完全连接的层有何不同?

2 个答案:

答案 0 :(得分:1)

总结来自这里的评论的答案。 主要区别在于效率。不需要在这些非常长的热矢量中编码数据点并进行矩阵乘法,使用embedding_column可以使用索引向量并进行矩阵查找。

答案 1 :(得分:0)

代表类别。

“一键编码”和“嵌入”列都是代表分类特征的选项。

“一键编码”的问题之一是它不编码类别之间的任何关系。它们彼此完全独立,因此神经网络无法知道哪些彼此相似。

可以通过用嵌入表示分类特征来解决此问题 柱。这个想法是每个类别都有一个较小的向量。值是权重,类似于用于神经网络中基本特征的权重。

更多:

https://developers.googleblog.com/2017/11/introducing-tensorflow-feature-columns.html