我有2个不平衡的类,50 000个样本和正数在集合中出现%5。数据是二维的。
问题是,我正在使用 ExtraTreesClassifier 。 oob_score _ 看起来不错,但当我使用 cross_validation.cross_val_score 检查 f1得分时,我得到的值很低。我完全混淆了我的分类器是好的还是垃圾。
<cassandra:cluster contact-points="value1,value2,value3" />
打印 0.919955 0.919353 0.919353 ......越来越多。
我做的时候
from sklearn.ensemble import ExtraTreesClassifier
trees = ExtraTreesClassifier(bootstrap=true, oob_score=True,n_estimators=100,class_weight="auto")
for i in range(1, 101):
trees.set_params(n_estimators=i)
trees.fit(x,y)
print trees.oob_score_
结果是 数组([0.01604747,0.01250169]) ,这很糟糕。
有人可以开导我吗?提前谢谢。
答案 0 :(得分:0)
超出行李评分指标的准确性。鉴于数据不平衡,结果是正常的。
有一个停滞的拉取请求,允许选择评分指标 https://github.com/scikit-learn/scikit-learn/pull/3723
目前,您仍然可以使用oob_decision_score_属性计算oob f1-score。