标签: information-retrieval
在研究相关性反馈(伪相关性反馈)时,我了解到模型对某些查询可能会出现严重错误。任何人都可以说明原因吗?
答案 0 :(得分:0)
该问题也称为查询偏差:如果top-k检索到的文档全部(或大部分)是关于特定子主题的,则反馈会提升此类子主题的重要性机构。
教科书示例是关于“铜矿”的查询:如果大部分检索到的文件都是关于“智利的铜矿”,则反馈过程将将结果漂移到智利的文件上。