鉴于特定的阈值,我能够生成以下两种格式: -
Set<String> observedDocs;
Set<String> actualDocs;
现在我必须提出真实阳性率和误报率。 TPR易于计算,它是一种非常直观的召回定义,我通过以下方式进行: -
private double recall(final Set<String> observedDocs, final Set<String> actualDocs) {
Set<String> relevantAndRetrieved = new HashSet<>(observedDocs);
relevantAndRetrieved.addAll(actualDocs);
return relevantAndRetrieved.size() / actualLabels.size();
}
我需要一些等效的基于集合操作的方法来计算误报率。我不想计算假阳性,假阴性计数等。
答案 0 :(得分:0)
嗯,FPR是负面例子的比例,被分类者标记为正面。但我不知道如何根据你所拥有的变量来表达这一点。你的recall
功能如何运作? observedLabels
和actualLabels
最多只有2个元素,对吧?你的意思是制作那些List
而不是Set
??