访问ElasticSearch文档的规范化标记

时间:2016-02-25 07:59:38

标签: elasticsearch solr

我在ElasticSearch文档中的文本字段上使用标准英语分析器。

我有兴趣访问规范化条款列表,因此,如果文字为"Set the shape to semi-transparent by calling set_trans(5)",我想访问规范化的令牌set, shape, semi, transpar, call, set_tran, 5

这可能吗?

2 个答案:

答案 0 :(得分:2)

您可以使用Analyze API,您可以询问任何字符串并获取从中提取的标记 来自Documentation

的示例
curl -XGET 'localhost:9200/_analyze' -d '
{
  "tokenizer" : "keyword",
  "filters" : ["lowercase"],
  "text" : "this is a test"
}'

curl -XGET 'localhost:9200/_analyze' -d '
{
  "tokenizer" : "keyword",
  "token_filters" : ["lowercase"],
  "char_filters" : ["html_strip"],
  "text" : "this is a <b>test</b>"
}'

答案 1 :(得分:2)