是一个热编码没有虚拟陷阱

时间:2018-05-14 13:39:01

标签: machine-learning deep-learning bigdata data-science

在一个热编码器中有一个叫做虚拟陷阱的东西,当我们用3个类别对分类列进行编码,以免说a,b和c然后用一个热编码器我们得到3个类别或者列a,b和c但是当我们使用get_dummies时,我们得到2列而不是a,而b则是从虚拟陷阱中保存。是一个暴露于虚拟陷阱的热门编码或它负责它。我对吗?哪一个是假陷阱?或者可以同时使用我们的删除列,iam使用数据集进行许多算法。

寻求帮助。提前致谢。

1 个答案:

答案 0 :(得分:0)

OneHotEncoder无法直接处理字符串值。如果您的名义特征是字符串,那么您需要首先将它们映射为整数。

pandas.get_dummies恰恰相反。默认情况下,除非指定了列,否则它仅将字符串列转换为单热表示。