search.highlight的预期行为-每个标记被标记包围还是多个标记被一个标记包围?

时间:2019-04-12 12:05:13

标签: azure-search

选择highlight=fieldX时,Azure搜索结果中出现的搜索突出显示让我的团队有些困惑。

在搜索参数中使用双引号来搜索简单语法的短语时,观察到search.highlights部分的结果时,有人认为它不是在搜索整个短语,而是在搜索结果包含该短语中的一些(如果不是全部)标记。

例如:search="quick brown"&highlight=content可能会导致

{"@odata.context": "https://az-srch-example.search.windows.net/indexes('example')/$metadata#docs(*)",
"value": [
    {
        "@search.score": 0.683709,
        "@search.highlights": {
            "content": [
                "The <em>quick</em> <em>brown</em> fox jumped over the lazy dog."
            ]
        },
        "id": "abcexample123"
    }
]}

人们认为我们可能会收到独立搜索“快速”和“棕色”的结果。

在搜索结果连续或短语时,是否有任何语法可用于合并搜索突出显示?

谢谢您的指导!

1 个答案:

答案 0 :(得分:2)

  

当搜索结果是连续的或短语时,是否有用于合并搜索突出显示的语法?

简而言之

在Azure搜索中,我们使用Lucene的发布荧光笔。突出显示匹配的文档被识别后。因此,Postings Highlighter将每个匹配的文档取为,将其拆分为句子,然后查找与查询词最匹配的句子(忽略词义位置),这就是为什么您看到所有词组都被单独突出显示的原因。

很遗憾,目前无法自定义此行为。您可以对此feedback投赞成票,以促进该功能的实现。