如果数据集具有多个分类值,那么我们是否需要对所有分类数据执行OneHotEncoding,然后如何消除虚拟变量的问题。
答案 0 :(得分:0)
不清楚您要解决的问题。通常,在机器学习中,您可以进行一键编码或标签编码,但是在将分类值传递到建模之前,需要对其进行编码。
IMO,标签编码更简单,可以帮助进行经典的回归/分类,并且在计划应用深度学习时可以使用Onehot编码。有关更多讨论,请访问:https://datascience.stackexchange.com/questions/9443/when-to-use-one-hot-encoding-vs-labelencoder-vs-dictvectorizor
说过,您可以像这样进行标签编码:
weak_ptr