为什么ELI5概率与预测_proba不同

时间:2020-10-14 20:30:20

标签: scikit-learn logistic-regression multilabel-classification tfidfvectorizer eli5

我有一个由['RC12_4', 'RC100_', 'RC101_', 'RC102_', 'RC103_', 'RC104_', 'RC109_', 'RC111_', 'RC114_', 'RC115_', 'RC116_', 'RC117_', 'RC118_', 'RC119_', 'RC120_', 'RC121_', 'RC122_', 'RC125_', 'RC126_', 'RC129_'] sorted(listName, key=lambda x: x.split('_')[0]) Is there a way to modify this script so that it sorts by the first item after RC and before the underscore? Or is there an easier way? 组成的sklearn管道,安装在多标签训练数据集上。然后,当我在样本上使用ELI5 TfidfVectorizer(使用管道中的矢量化器和分类器)时,与在同一样本上使用SGDClassifier(loss='log')时,得到的概率不同。为什么会这样?

0 个答案:

没有答案