二进制向量作为roc_curve的y_score参数

时间:2014-02-17 12:28:04

标签: scikit-learn roc

sklearn roc_curve docstring声明:

“y_score:array,shape = [n_samples] 目标分数可以是正类的概率估计,置信度值或二元决策。“

在什么情况下将y_score设置为二进制向量(“二元决策”)是有意义的?这不会导致一个ROC曲线上有一个点,哪一种无视这一点?

1 个答案:

答案 0 :(得分:4)

如果您使用的分类器不输出概率分数(例如svm.SVC而没有明确的probability=True),则无法计算ROC曲线。作为API设计者,您有两种选择:引发异常并向用户提供无有用的信息,或使用一个数据点绘制退化曲线。我认为后者更有用。