标签: machine-learning statistics classification logistic-regression imbalanced-data
这可能是一个愚蠢的问题。
假设我们针对二元分类问题训练了一个分类器(逻辑回归,RandomForest,朴素贝叶斯等)。我们使用该分类器来预测测试数据中“ 1”的概率。对于测试数据中的每个样本,我们都可以得到一个概率。
可以通过(#label'1'sample)/(#all_samples)轻松计算出测试数据集的实际目标速率。
有时我们会对测试数据的“预测目标率”感兴趣,我看到一些示例使用测试数据中所有样本的预测概率平均值作为“预测目标率”。它背后的逻辑是什么?
谢谢