Question

我有下面的数据集，但它的值是字符串。因此，当我要训练决策树时，应通过标签编码将这些功能转换为num。 如何在可视化步骤和规则导出中将这些字符串打印到决策树上？

feature1  feature2  feature3  feature4  target
low       low       medium    high      sick
low       high      medium    medium    sick
high      medium    low       high      health
...

这是我创建决策树的代码：

le = preprocessing.LabelEncoder()
le.fit(data)
encoded_data = le.transform(data) 
tree.fit(encoded_data, target)

Answer 1

打印出类的映射：

list(le.classes_)

将标签反向转换为类别：

list(le.inverse_transform(list_of_labels))

文档here。

您也可以使用pandas .factorize()：

cat_list = ['a', 'b', 'c', 'd', 'd']
encoded_data, mapping_index = pd.Series(cat_list).factorize()

特别决策树

1 个答案: