假设我们有一个热门编码的数据[a,d,c,a,b],那就是
a:1,0,0,0
b:0,1,0,0
c:0,0,1,0
d:0,0,0,1,
So the [a,d,c,a,b] is
[1,0,0,0,0,0,0,1,0,0,1,0,1,0,0,0,0,1,0,0]
当我输入嵌入层时。 对于其他编码类型,[a,d,c,a,b]可以表示为,dim = 4,
[0,3,2,0,1]
,然后输入嵌入层。
那么这两种编码类型到底有什么区别?有没有比较这两种编码的论文?我刚刚在Keras找到了一个热门编码"是第二种类型。