DecisionTreeClassifier如何查找下一个值

时间:2018-04-10 14:26:37

标签: python machine-learning scikit-learn

如何在从训练集构建决策树后找到下一个值? 当我输入B和C值时,我需要知道我的例子中A字段的下一个值的概率。

df = pd.DataFrame(np.random.randint(low=0, high=10, size=(5, 3)),
                    columns=['a', 'b', 'c'])

>>>
    a   b   c
0   2   8   8
1   4   2   9
2   1   0   7
3   5   1   7
4   6   0   2

X = df[ ['b','c'] ]
Y = df[ ['a'] ]

clf = DecisionTreeClassifier(random_state=241)
clf.fit(X, Y)

如果B = 8,C = 8?

,如何找出字段A的下一个值的概率

1 个答案:

答案 0 :(得分:-1)

您只需使用clf.predict_proba()即可。例如:

clf.predict_proba([[8,8]])

将返回一个float向量,表示数据是“a”列中每个唯一值的概率。