我已经使用文本分类在3种方言上训练了分类器。这就是混淆矩阵和精度:
混乱矩阵
[[27 6 0 16]
[ 5 18 0 21]
[ 1 3 6 9]
[ 0 0 0 48]]
精度
[0.81818182 0.66666667 1. 0.5106383 ]
如何知道混淆矩阵中的哪一行以及精度中的哪个元素属于我所拥有的方言?我使用以下标签向分类器提供了训练数据:
Egyptian
Sudan
Iraqi
Jordan
这是代码,我使用了RandomForestClassifier:
from sklearn.ensemble import RandomForestClassifier
classifier = RandomForestClassifier(n_estimators=1000, random_state=0)
classifier.fit(X, labels)
test_pred = classifier.predict(y)
precision_score(labels_test,test_pred,average=None)
输出:
array([0.91024735, 0.94929397, 0.98622273, 0,95343322])
答案 0 :(得分:1)
classifier.classes_
将为您提供分类器评分的标签,这些标签按照存储在分类器对象中的顺序排列。这应该与您已经获得的输出顺序相同,尽管我会通过对您的预测进行抽查来确保这一点