关于tree.DecisionTreeClassifier调整class_weight

时间:2016-08-23 00:45:28

标签: python tree classification

我有一个不平衡的数据集,共有209行(样本),包括166行(class0)和43行(class1)。 因此,我想解决不平衡问题, 然后我用python指令来调整班级重量。

tree.DecisionTreeClassifier(max_depth=4,class_weight={1:3.8})
clf.fit(scale_data, data_answer

最后,在结果(图1)中,样本仍然是209但是值变为166.0(class0)和166.34(class1)。 class1对十进制后的数字进行采样。 我无法解释结果,甚至无法编译由Cpython(https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/tree/_tree.pyx#L1948>)编写的源代码 谁能帮助我? 谢谢。

fig.1

1 个答案:

答案 0 :(得分:0)

第1类不会对小数点后的数字进行采样。"我不确定这甚至意味着什么。相反,样本是加权的,因此值为43 * 3.8 = 163.4