我试图找出解决这个问题的最佳方法。假设我有一个用户输入一个简短的句子,我希望将这个句子(本质上是一个查询)与分配给用户的一小组文档相匹配。我面临的问题是,与谷歌搜索不同的是,与低相关文档高度相关的列表是有意义的,我想在没有用户干预的情况下自动选择这些文档的子集。有没有办法过滤掉低相关性'文件?
在研究这个问题时,答案似乎是否定的,因为来自elasticsearch的_score不是从查询到查询的一致规模(并且文档说明min_score是愚蠢的使用)。有没有办法过滤掉那些给定查询没有至少90%max_score的_score的结果(我确定这可以用处理结果的语言来完成,如果ES提供的话很奇怪这通过一些内置的功能)?如何过滤不匹配多个术语的文档(因此,只删除了查询中一个术语的文档)?
感谢您的任何见解!