Elasticsearch - 文档中片段的位置

时间:2015-06-13 16:16:07

标签: elasticsearch

我正在执行如下所示的短语查询。它返回按相关性排序的突出显示的片段。当然,我希望用户点击一个片段,然后我将文档滚动到相应的位置。但是,我没有在Elasticsearch中找到任何方法来找出原始文档中片段的位置。有什么想法吗?

GET documents/doc/_search
{
   "query": {
        "match_phrase": {
            "text": {
                "query": "hello world",
                "slop":  10
            }
        }
    }, 
    "highlight" : {
        "order" : "score",
        "fields" : {
            "text" : {"fragment_size" : 100, "number_of_fragments" : 10}
        }
    }
}

1 个答案:

答案 0 :(得分:2)

与此同时,我们无法找到合适的解决方案并最终得到以下黑客攻击(对我们非常有效): 在编制索引之前,我们使用" [index]"来注释文本中的每个单词,以便" 将某些文本编入索引"变为" 某些[00]文[01]至[02]索引[03] "。然后我们使用char过滤器,如下所示。当返回高光时,我们从高亮文本中解析出单词位置。

"settings": {
    "analysis": {
      "char_filter": {
        "remove_annotation": {
          "type": "pattern_replace",
          "pattern": "\\[[0-9]+\\]",
          "replacement": ""
        }
      },
      "analyzer": {
        "annotated_english_language_analyzer": {
          "type": "custom",
          "char_filter": [
            "remove_annotation"
          ],
          ...

请注意,注释索引应填充到log10(text_length)+1个数字,以便找到的突出显示的宽度(删除注释后)不会取决于找到它的位置(开头与结尾)。