确定未排序列表的评估方法(组)

时间:2018-08-30 17:04:48

标签: python scikit-learn precision evaluation precision-recall

我有一个数据框,如下所示: enter image description here

  1. 第0列(0,1,2,3 ...)指向document_ids
  2. 40041,37962,37985 ...是表示与文档相关的对象的id。例如,document_id 2具有相关的(真实)对象37985和预测的对象37985,37983。
  3. 真相–实际物体(金标准)
  4. 预测-我的算法预测的对象
  5. 重叠-事实列表和预测列表中都存在对象
  6. 未检测到–对象存在于“真相”列表中,但未被算法检测到。

我的问题:

  • 给定以下数据集,我可以使用哪些评估方法?精度将无法实现,因为我还没有误报。准确性或jaccard相似度如何? Scikit列出了几种评估措施here。我正在寻找评估未排名列表的方法。

0 个答案:

没有答案