定义Azure搜索得分的阈值

时间:2019-01-24 05:39:08

标签: azure-search

全部,               我们的应用程序中有一个案例,其中我们收集用户满意度反馈,以了解从Azure搜索返回的数据匹配项。到目前为止,我们已经从有限的反馈中注意到,分数与用户满意度之间存在相关性(高分数会导致更好的用户满意度,因为找到了更有用的匹配项)。当Azure搜索得分高于2.5时,这似乎会为我们的应用程序带来“幸福”等级。但是我们不确定这是否只是巧合,这种方法是否合理。               我们不知道Azure搜索得分的最大范围(例如0-10)是多少。同样,该链接似乎表明分数也会随数据集的变化而变化(即使考虑到本例中相同的查询用于不同的输入数据),甚至有可能在Azure Search分数上定义阈值可以丢掉得分很低的匹配项,而在我们的应用程序中根本不向用户显示?有什么建议吗?

https://stackoverflow.com/a/27364573

谢谢。

1 个答案:

答案 0 :(得分:0)

您所链接问题的答复是准确的。分数值取决于您索引中的语料库,因为它使用诸如“文档频率”之类的变量,该变量取决于您索引中的文档。这样,当在两个不同索引的上下文中计算时,相同的查询文档对可能具有不同的分数。

该分数也没有任何具体范围,因为它并不打算用作在不同查询的结果之间进行比较的绝对值。得分值旨在用于在同一索引内对文档与特定查询的相对相关性进行排名。

但是,由于分数是作为搜索结果的一部分返回的,因此如果您断定分数合理,则没有什么可以阻止您在应用程序中使用自己的客户端过滤功能来消除分数低于特定阈值的结果在您的产品范围内。