基于Elasticsearch字符串的查询以匹配正则表达式

时间:2019-01-22 10:28:26

标签: regex elasticsearch elasticsearch-query

我想知道是否可以进行基于字符串的查询以匹配Elasticsearch中的正则表达式。

我知道还有另一种方法(进行正则表达式查询以匹配Elasticsearch文档中的字符串),但是我可以基于字符串进行查询并使用Elasticsearch匹配文档中保存的正则表达式吗?

例如,我有一个文档,其中填充了如下数据:输入(正则表达式)和输出(描述正则表达式):

{
  "input": "[0-9]+ ?kg",
  "output": "weight"
}

我可以使用字符串“ 67kg”进行查询以匹配正则表达式并获取它:

{
  "took" : 1,
  "timed_out" : false,
  "_shards" : {
    "total" : 5,
    "successful" : 5,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : 1,
    "max_score" : 1.0,
    "hits" : [
      {
        "_index" : "test1",
        "_type" : "type",
        "_id" : "XqXucGgBXOzlaMdqiLcI",
        "_score" : 1.0,
        "_source" : {
          "input" : "[0-9]+ ?kg",
          "output" : "weight"
        }
      }
    ]
  }
}

1 个答案:

答案 0 :(得分:0)

您可以使用Percolate Query 功能来实现类似目的。

以下基本概念是,您的文档就是查询,您可以将它们与文档进行搜索,以查看这些文档是否匹配。

您需要使用特殊字段类型-percolator创建索引。例如,

PUT /my-index
{
    "mappings": {
        "_doc": {
            "properties": {
                "input": {
                    "type": "keyword"
                },
                "query": {
                    "type": "percolator"
                }
            }
        }
    }
}

在此之后,添加一个文档(该查询将使您的字段input与正则表达式匹配)

例如,

PUT /my-index/_doc/1
{
    "query" : {
        "regexp" : {
            "input" : "[0-9]+( kg)?"
        }
    }
}

例如,您可以根据自己的需求在此处尝试其他查询。

在此之后,通过执行以下操作来测试您的文档如何再次匹配哪个查询:

GET /my-index/_search
{
    "query" : {
        "percolate" : {
            "field" : "query",
            "document" : {
                "input" : "67 kg"
            }
        }
    }
}