我当前正在使用Azure搜索在我的网站上执行产品搜索。
我有以下索引:
A :索引包含55,000个文档
B :包含16个文档
索引 B 中的所有文档均已填充索引 A 文档
在两个具有相同参数的索引中执行简单搜索时,结果不是我期望的。
示例:
结果按search.score降序排列:
ProductoName - search.score
肯德基商品1-1.6514521
肯德基产品2-1.5482594
结果按search.score降序排列:
ProductoName - search.score
肯德基产品2-0.21555252
肯德基产品1-0.13616839
文件数量会影响搜索分数的分配?,您能指出我在哪里可以读到它,我在文件中查找但没有找到任何内容
您能否向我解释如果相同的信息为什么会影响产品的订购? :(
索引没有评分资料,并且信息完全相同
答案 0 :(得分:0)
您的分析是正确的,得分(因此排名)确实受到索引中文档数量的影响。为了计算分数,我们使用了数据语料库的一些统计特征,例如整个语料库中和每个文档中每个术语的出现频率。
文章How full text search works in Azure Search对此进行了详细说明。特别是,Scoring上的部分介绍了如何使用频率(术语频率,文档频率)。