在scikit-learn
内运行交叉验证时,所有分类器都有一个工厂函数score()
,我可以轻松检查分类器的准确性,例如来自http://scikit-learn.org/stable/modules/cross_validation.html
>>> import numpy as np
>>> from sklearn import cross_validation
>>> from sklearn import datasets
>>> from sklearn import svm
>>> iris = datasets.load_iris()
>>> iris.data.shape, iris.target.shape
((150, 4), (150,))
>>> X_train, X_test, y_train, y_test = cross_validation.train_test_split(
... iris.data, iris.target, test_size=0.4, random_state=0)
>>> X_train.shape, y_train.shape
((90, 4), (90,))
>>> X_test.shape, y_test.shape
((60, 4), (60,))
>>> clf = svm.SVC(kernel='linear', C=1).fit(X_train, y_train)
>>> clf.score(X_test, y_test)
0.96...
在深入了解scikit-learn
的github回购之后,我仍然无法弄清楚clf.score()
函数的函数在哪里。
有这个链接,但它不包含score()
,https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/svm/classes.py
score()
分类符的sklearn
函数位于何处?
我可以implement my own score function easily,但目的是建立我的库,使其与sklearn
分类器保持一致,不会提出我自己的评分函数 = )
答案 0 :(得分:5)
scikit-learn分类器的默认score()
方法是准确度分数,为defined in the ClassifierMixin
class。这个mixin是大多数(全部?)scikit-learn的内置分类器的父类。
如果您正在编写自己的分类器,我建议您继续使用此mixin和BaseEstimator
,这样您就可以自动获得模型的评分和其他功能。