应用错误收集

在Watson Discovery API中，我应使用哪个结果来确定最相关的文档：得分或置信度？

时间：2019-03-20 14:07:12

标签： ibm-watson discovery

我从事的Discovery系列从未进行过培训。当我在集合上启动自然语言查询时，在检索到的文档的result_metadata中，我看到2个概念：得分和置信度例如： “信心”：0.0847209066468392， “得分”：3.4830062 标签“ retrieval_details”的值为“ document_retrieval_strategy”：“未训练”

在文档中，首先写道：“将为受过训练和未经训练的私人收藏返回置信度分数”，此外，“具有未受训练的document_retrieval_strategy的结果的置信度分数是无监督估计值的相关性文档结果将用于查询；它与训练有素的集合返回的分数不能互换。训练有素的集合比未经训练的集合可以更好地回答自然语言查询。” 恰恰：这是什么意思？该置信度分数如何计算？我应该使用哪个结果来获取最相关的文档：得分或置信度？

1 个答案:

答案 0 :(得分：0)

您需要使用信心。分数绝不能用于定义阈值，因为它是相对计算。

还建议将“ document_retrieval_strategy”用作阈值的一部分，每种策略的阈值都不同，或者至少对受过训练的策略有一个阈值，对于未受过训练的策略至少有一个阈值，因为根据该策略，置信度的处理方式会有所不同已应用。

This post可以为您提供一些有关如何定义阈值的想法。