如果我们有多个分类列多类怎么办?

时间:2019-06-12 18:04:18

标签: python deep-learning dataset one-hot-encoding dummy-variable

如果数据集具有多个分类值,那么我们是否需要对所有分类数据执行OneHotEncoding,然后如何消除虚拟变量的问题。

1 个答案:

答案 0 :(得分:0)

不清楚您要解决的问题。通常,在机器学习中,您可以进行一键编码或标签编码,但是在将分类值传递到建模之前,需要对其进行编码。

IMO,标签编码更简单,可以帮助进行经典的回归/分类,并且在计划应用深度学习时可以使用Onehot编码。有关更多讨论,请访问:https://datascience.stackexchange.com/questions/9443/when-to-use-one-hot-encoding-vs-labelencoder-vs-dictvectorizor

说过,您可以像这样进行标签编码:

weak_ptr