在一个热编码器中有一个叫做虚拟陷阱的东西,当我们用3个类别对分类列进行编码,以免说a,b和c然后用一个热编码器我们得到3个类别或者列a,b和c但是当我们使用get_dummies时,我们得到2列而不是a,而b则是从虚拟陷阱中保存。是一个暴露于虚拟陷阱的热门编码或它负责它。我对吗?哪一个是假陷阱?或者可以同时使用我们的删除列,iam使用数据集进行许多算法。
寻求帮助。提前致谢。答案 0 :(得分:0)
OneHotEncoder
无法直接处理字符串值。如果您的名义特征是字符串,那么您需要首先将它们映射为整数。
pandas.get_dummies
恰恰相反。默认情况下,除非指定了列,否则它仅将字符串列转换为单热表示。