标签: python scikit-learn decision-tree one-hot-encoding
我有一个涉及离散和连续数据变量的数据集。例如:性别,职业,薪水。薪水是一个包含大量信息来预测我班级的领域。现在我有一个由One Hot Encoder映射的Gender和Occupation列。如何将工资值映射到我作为编码结果得到的输出数组。
在这个问题中,我试图使用决策树对数据进行分类,因此我希望薪水保留它的值,以便决策树能够使用普通数字运算符预测最终的类。