如何用文本数据在python中绘制ROC曲线?

时间:2020-07-16 10:47:59

标签: python matplotlib roc

我想绘制ROC曲线,以便使用朴素模型作为分类来显示TPR与FPR。

我已经矢量化了我的数据。

当我运行代码时,它显示以下错误:

raise NotFittedError(msg % {'name': type(estimator).__name__}) sklearn.exceptions.NotFittedError: CountVectorizer - Vocabulary wasn't fitted

代码:

#Create ROC curve
from sklearn.metrics import roc_curve, auc
import matplotlib.pyplot as plt
pred_probas = pipeline.predict_proba(X_test)[:,1]
fpr,tpr,_ = roc_curve(y_test, pred_probas)
roc_auc = auc(fpr,tpr)
plt.plot(fpr,tpr,label='area = %.2f' %roc_auc)
plt.plot([0, 1], [0, 1], 'k--')
plt.xlim([0.0, 1.0])
plt.ylim([0.0, 1.05])
plt.legend(loc='lower right')

plt.show()

1 个答案:

答案 0 :(得分:0)

错误指向CountVectorizer,而不是ROC曲线。这可能很有帮助CountVectorizer: Vocabulary wasn't fitted