如何确定为什么在SOLR响应中返回的某些文档可能与给定的关键字搜索不相关?

时间:2019-04-12 17:22:22

标签: solr wcs

我们在WCS SOLR响应中看到某些与给定搜索关键字无关的文档,但它们是当前客户/站点目录和类别的一部分。我确实看到了SOLR调试信息,解析器查询,过滤器等。但是试图知道是否有可能知道为什么响应中包含文档。我确实看到了解释字符串,并且没有花时间了解其背后的整个算法,想看看是否有一种快速的方法来知道为什么文档位于结果/响应列表中。这可能有助于确定目录的类别数据结构问题或我们的SOLR实现中的任何错误。

是否有可能在响应中的每个返回文档级别看到调试信息,如果这有助于了解SOLR的配置方式以及在环境中的工作情况?

谢谢

1 个答案:

答案 0 :(得分:2)

在请求中传递debugQuery=true时,您可以在响应的debug/explain节点中查看每个文档得分的原因。该信息将大致如下所示:

...
"debug": {
  ...
  "explain": {
    "id:1": "info about the score for document 1",
    "id:2": "info about the score for document 2",
    "id:3": "info about the score for document 2",
    "id:4": "info about the score for document 4",
    ...
  }
}

信息并不是很容易解析和破译,但它可能是一个很好的起点。

我在此博客文章中详细解释了如何阅读explain部分中的信息:https://library.brown.edu/DigitalTechnologies/understanding-scoring-of-documents-in-solr/