我确实有一个大型数据集,它有2个功能但很多样本。我试图通过有监督的分类器对它们进行分类。我的目标是实现哪些类具有精度或召回率低于60%。是否有任何特定的脚本可以运行,以获得精确的类号和召回率低于60%?
我到目前为止应用的代码如下所示,但它不是动态的。 我可以用这一行得到分类报告:" print(metrics.classification_report(y_test,y_pred))" 但我有200个类标签,我只想选择精度高,回忆率低于60%。
scores = cross_val_score(estimator= DecisionTreeClassifier(),
X=X_train,
y=y_train,
cv=5,
n_jobs=-1)
print('CV accuracy scores: %s' % scores)
print('CV accuracy: %.3f +/- %.3f' % (
np.mean(scores), np.std(scores)))
model.fit(X_train, y_train)
y_pred = model.predict(X_test)
print('Test Accuracy: %.3f' % model.score(X_test, y_test))
print(metrics.classification_report(y_test, y_pred))