我在ElasticSearch文档中的文本字段上使用标准英语分析器。
我有兴趣访问规范化条款列表,因此,如果文字为"Set the shape to semi-transparent by calling set_trans(5)"
,我想访问规范化的令牌set, shape, semi, transpar, call, set_tran, 5
。
这可能吗?
答案 0 :(得分:2)
您可以使用Analyze API,您可以询问任何字符串并获取从中提取的标记 来自Documentation
的示例curl -XGET 'localhost:9200/_analyze' -d '
{
"tokenizer" : "keyword",
"filters" : ["lowercase"],
"text" : "this is a test"
}'
curl -XGET 'localhost:9200/_analyze' -d '
{
"tokenizer" : "keyword",
"token_filters" : ["lowercase"],
"char_filters" : ["html_strip"],
"text" : "this is a <b>test</b>"
}'
答案 1 :(得分:2)