python onehotencoding或labelencoding为2级的类别变量?

时间:2018-02-05 10:27:11

标签: machine-learning categorical-data

我正在使用ML处理二进制分类问题,其中我的数据只有2个级别,其中一个级别比另一个级别更重要。它不是纯粹的分类(这与性别不完全相同)。在这种情况下,与单纯的LabelEncoder相比,仅仅2个级别的onehotencoder会产生如此大的差异吗? 在什么情况下我们使用onehotencoding / labelencoding?

1 个答案:

答案 0 :(得分:0)

这取决于您将在数据上使用的机器学习算法。

你的最终目标是什么?它是分类吗?是集群吗?

如果是分类,那么使用某些分类器只有在你有一个热编码标签时才有意义。

一般情况下,如果您对分类功能进行一次热编码,则最好进行分类。