python - 如何在列的值上拆分决策树 - Thinbug

如何在列的值上拆分决策树

时间：2020-07-24 22:09:52

标签： python scikit-learn decision-tree

我正在尝试解决问题，但无法完成此阶段。

我正在研究“乳腺癌”数据集。

首先，考虑建立一个简单的一级决策树，将肿瘤分类为良性或恶性。

考虑以下两个潜在的分歧

分裂半径最差处为16.8
在最差半径19.8处分裂

对于这些拆分中的每一个，计算所得的均方误差。均方误差是多少没有分裂的数据集的杂质？（请注意：如果您想知道使用的适当性关于二元结果的均方误差，请参阅您的二元决策树中的可选讲义课程讲义）。根据这些结果，这两个拆分中哪一个最好？

剩下的问题我都做完了，只是想弄清楚如何在列的值上拆分决策树。

我认为这与决策树分类器模型的（splitter =）参数有关。有人可以帮我吗？

代码

from sklearn.tree import DecisionTreeClassifier as dt


model = dt(max_depth=1)
model.fit(X_train, y_train)
predictions = model.predict(X_test)

0 个答案:

没有答案