训练机器学习模型时是否需要对目标列进行热编码或标签编码

时间:2019-11-03 17:11:59

标签: machine-learning pyspark data-science one-hot-encoding

具有列的数据集- 目标列-水果名称(数据-芒果,橙色,苹果), 功能列-大小(数字),颜色(红色,绿色,黄色),重量(数字)

我已经对color列进行了一次热编码并准备了功能,每一列都有数字值。

我要使用分类模型进行预测。

如果我要在其上进行预测的目标列包含分类数据(例如,apple,orange,mango),那么如果我要使用逻辑回归模型(基于分类的模型) ,是否也需要像对功能列(名称-颜色)一样,对目标列进行一次热编码或标签编码。

谢谢

1 个答案:

答案 0 :(得分:0)

否,因为逻辑回归在输入X的情况下返回Y = y的概率,所以它将起作用。