如何一站式实施?一和零的数组还是仅仅是数字?

时间:2019-02-06 14:40:24

标签: implementation one-hot-encoding

因此,我正在学习一些ML,并且听说过一种热门编码。我对这个概念很好,但是我对实现感到怀疑...

说我们有一本10000字典,并用它编码单词。使用热点表示每个单词都是向量,所以:

  • 第一个单词:[1,0,0,...]
  • 第二个字:[0,1,0,...]

在我看来,使用10000位存储每个单词有点奇怪...我会为每个单词使用11位,因为二进制的10000是111 00010000。这样:

  • 第一个单词:000 0000 0001
  • 第二个字:000 0000 0010
  • 第三个单词:000 0000 0011

(或者您可以从0:000 0000 0000开始计数)

这是实施热点的一种方式吗?

0 个答案:

没有答案