在Watson Discovery API中,我应使用哪个结果来确定最相关的文档:得分或置信度?

时间:2019-03-20 14:07:12

标签: ibm-watson discovery

我从事的Discovery系列从未进行过培训。 当我在集合上启动自然语言查询时,在检索到的文档的result_metadata中,我看到2个概念:得分和置信度 例如:                 “信心”:0.0847209066468392,                 “得分”:3.4830062 标签“ retrieval_details”的值为“ document_retrieval_strategy”:“未训练”

在文档中,首先写道:“将为受过训练和未经训练的私人收藏返回置信度分数”,此外,“具有未受训练的document_retrieval_strategy的结果的置信度分数是无监督估计值的相关性文档结果将用于查询;它与训练有素的集合返回的分数不能互换。训练有素的集合比未经训练的集合可以更好地回答自然语言查询。” 恰恰:这是什么意思?该置信度分数如何计算?我应该使用哪个结果来获取最相关的文档:得分或置信度?

1 个答案:

答案 0 :(得分:0)

您需要使用信心。分数绝不能用于定义阈值,因为它是相对计算。

还建议将“ document_retrieval_strategy”用作阈值的一部分,每种策略的阈值都不同,或者至少对受过训练的策略有一个阈值,对于未受过训练的策略至少有一个阈值,因为根据该策略,置信度的处理方式会有所不同已应用。

This post可以为您提供一些有关如何定义阈值的想法。