ROC曲线数据点的计算(接收机操作员特性)

时间:2015-12-24 19:53:01

标签: statistics set roc

鉴于特定的阈值,我能够生成以下两种格式: -

Set<String> observedDocs;
Set<String> actualDocs;

现在我必须提出真实阳性率和误报率。 TPR易于计算,它是一种非常直观的召回定义,我通过以下方式进行: -

private double recall(final Set<String> observedDocs, final Set<String> actualDocs) {
    Set<String> relevantAndRetrieved = new HashSet<>(observedDocs);
    relevantAndRetrieved.addAll(actualDocs);
    return relevantAndRetrieved.size() / actualLabels.size();
}

我需要一些等效的基于集合操作的方法来计算误报率。我不想计算假阳性,假阴性计数等。

1 个答案:

答案 0 :(得分:0)

嗯,FPR是负面例子的比例,被分类者标记为正面。但我不知道如何根据你所拥有的变量来表达这一点。你的recall功能如何运作? observedLabelsactualLabels最多只有2个元素,对吧?你的意思是制作那些List而不是Set ??