二进制相关性和一个热编码之间的区别?

时间:2016-08-08 09:58:27

标签: encoding data-mining multilabel-classification one-hot-encoding

二元相关性是一种众所周知的技术,用于处理多标签分类问题,其中我们为特征的每个可能值训练二元分类器:

http://link.springer.com/article/10.1007%2Fs10994-011-5256-5

另一方面,一种热编码器(OHE)通常用于自然语言处理,以编码将多个值作为二元向量的分类特征:

http://cs224d.stanford.edu/lecture_notes/LectureNotes1.pdf

我们可以认为这两个概念是一样的吗?还是存在技术差异?

1 个答案:

答案 0 :(得分:3)

两种方法都不同。

<强> 1。 One-Hot编码

单热编码中,考虑向量。 enter image description here

上图表示二进制分类问题。

<强> 2。二元相关性

在二元相关性中,我们不考虑向量。下图表示使用二进制相关性方法生成类标签,该方法使用标量值。

enter image description here