标签: encoding data-mining multilabel-classification one-hot-encoding
二元相关性是一种众所周知的技术,用于处理多标签分类问题,其中我们为特征的每个可能值训练二元分类器:
http://link.springer.com/article/10.1007%2Fs10994-011-5256-5
另一方面,一种热编码器(OHE)通常用于自然语言处理,以编码将多个值作为二元向量的分类特征:
http://cs224d.stanford.edu/lecture_notes/LectureNotes1.pdf
我们可以认为这两个概念是一样的吗?还是存在技术差异?
答案 0 :(得分:3)
两种方法都不同。
<强> 1。 One-Hot编码
在单热编码中,考虑向量。
上图表示二进制分类问题。
<强> 2。二元相关性
在二元相关性中,我们不考虑向量。下图表示使用二进制相关性方法生成类标签,该方法使用标量值。