Question

我们在WCS SOLR响应中看到某些与给定搜索关键字无关的文档，但它们是当前客户/站点目录和类别的一部分。我确实看到了SOLR调试信息，解析器查询，过滤器等。但是试图知道是否有可能知道为什么响应中包含文档。我确实看到了解释字符串，并且没有花时间了解其背后的整个算法，想看看是否有一种快速的方法来知道为什么文档位于结果/响应列表中。这可能有助于确定目录的类别数据结构问题或我们的SOLR实现中的任何错误。

是否有可能在响应中的每个返回文档级别看到调试信息，如果这有助于了解SOLR的配置方式以及在环境中的工作情况？

谢谢

Answer 1

在请求中传递debugQuery=true时，您可以在响应的debug/explain节点中查看每个文档得分的原因。该信息将大致如下所示：

...
"debug": {
  ...
  "explain": {
    "id:1": "info about the score for document 1",
    "id:2": "info about the score for document 2",
    "id:3": "info about the score for document 2",
    "id:4": "info about the score for document 4",
    ...
  }
}

信息并不是很容易解析和破译，但它可能是一个很好的起点。

我在此博客文章中详细解释了如何阅读explain部分中的信息：https://library.brown.edu/DigitalTechnologies/understanding-scoring-of-documents-in-solr/

如何确定为什么在SOLR响应中返回的某些文档可能与给定的关键字搜索不相关？

1 个答案: