Azure搜索-搜索分数

时间:2019-02-09 00:35:40

标签: azure-search

我当前正在使用Azure搜索在我的网站上执行产品搜索。

我有以下索引:

A :索引包含55,000个文档
B :包含16个文档

索引 B 中的所有文档均已填充索引 A 文档

在两个具有相同参数的索引中执行简单搜索时,结果不是我期望的。

示例


索引A

查询字符串:search = kfc

结果按search.score降序排列:

ProductoName - search.score
肯德基商品1-1.6514521
肯德基产品2-1.5482594


索引B

查询字符串:search = kfc

结果按search.score降序排列:

ProductoName - search.score
肯德基产品2-0.21555252
肯德基产品1-0.13616839


我对搜索分数变化的结果顺序感到惊讶,因为它们是完全相同的数据,只是文档数量发生了变化

文件数量会影响搜索分数的分配?,您能指出我在哪里可以读到它,我在文件中查找但没有找到任何内容

您能否向我解释如果相同的信息为什么会影响产品的订购? :(

索引没有评分资料,并且信息完全相同

1 个答案:

答案 0 :(得分:0)

您的分析是正确的,得分(因此排名)确实受到索引中文档数量的影响。为了计算分数,我们使用了数据语料库的一些统计特征,例如整个语料库中和每个文档中每个术语的出现频率。

文章How full text search works in Azure Search对此进行了详细说明。特别是,Scoring上的部分介绍了如何使用频率(术语频率,文档频率)。