我从事的Discovery系列从未进行过培训。 当我在集合上启动自然语言查询时,在检索到的文档的result_metadata中,我看到2个概念:得分和置信度 例如: “信心”:0.0847209066468392, “得分”:3.4830062 标签“ retrieval_details”的值为“ document_retrieval_strategy”:“未训练”
在文档中,首先写道:“将为受过训练和未经训练的私人收藏返回置信度分数”,此外,“具有未受训练的document_retrieval_strategy的结果的置信度分数是无监督估计值的相关性文档结果将用于查询;它与训练有素的集合返回的分数不能互换。训练有素的集合比未经训练的集合可以更好地回答自然语言查询。” 恰恰:这是什么意思?该置信度分数如何计算?我应该使用哪个结果来获取最相关的文档:得分或置信度?
答案 0 :(得分:0)
您需要使用信心。分数绝不能用于定义阈值,因为它是相对计算。
还建议将“ document_retrieval_strategy”用作阈值的一部分,每种策略的阈值都不同,或者至少对受过训练的策略有一个阈值,对于未受过训练的策略至少有一个阈值,因为根据该策略,置信度的处理方式会有所不同已应用。
This post可以为您提供一些有关如何定义阈值的想法。