sklearn,ExtraTreesClassifier的得分困惑

时间:2015-07-20 09:41:20

标签: scikit-learn ensemble-learning

我有2个不平衡的类,50 000个样本和正数在集合中出现%5。数据是二维的。

问题是,我正在使用 ExtraTreesClassifier oob_score _ 看起来不错,但当我使用 cross_validation.cross_val_score 检查 f1得分时,我得到的值很低。我完全混淆了我的分类器是好的还是垃圾。

<cassandra:cluster contact-points="value1,value2,value3" />

打印     0.919955     0.919353     0.919353 ......越来越多。

我做的时候

from sklearn.ensemble import ExtraTreesClassifier
trees = ExtraTreesClassifier(bootstrap=true, oob_score=True,n_estimators=100,class_weight="auto")

for i in range(1, 101):
    trees.set_params(n_estimators=i)    
    trees.fit(x,y)
    print trees.oob_score_

结果是     数组([0.01604747,0.01250169]) ,这很糟糕。

有人可以开导我吗?提前谢谢。

1 个答案:

答案 0 :(得分:0)

超出行李评分指标的准确性。鉴于数据不平衡,结果是正常的。

有一个停滞的拉取请求,允许选择评分指标 https://github.com/scikit-learn/scikit-learn/pull/3723

目前,您仍然可以使用oob_decision_score_属性计算oob f1-score。