标签: one-hot-encoding
我的数据中有一个功能可以代表不同类型的帐户(基本上是数字,例如15、2、40等)。 我决定使用get_dummies()在该列上使用一键编码。
该模型正在处理欺诈检测问题,因此我大约拥有欺诈数据的1%。 在执行一次性测试之前,该模型能够预测一些欺诈行为。 一口气之后-它什么也没预测。 0。
我认为这是由于“一键编码”的缘故-它具有许多功能,而且可能没有效果。
这有意义吗?在这种情况下我该怎么办? 谢谢!