Tokenizer,用于分割带有下划线的单词,但也保留完整版本

时间:2012-11-03 20:50:30

标签: elasticsearch

我正在为其中包含文件名的内容实施Elasticsearch搜索,例如 “golf_master_2009.xls”。我想要一个将它分成至少以下标记的标记器:“golf”,“master”,“golf_master_2009.xml”。现在我必须使用通配符(例如“ master ”),如果我想搜索它而不指定完整的文件名。

2 个答案:

答案 0 :(得分:0)

您可以使用多字段字段应用差异分析器。 见http://www.elasticsearch.org/guide/reference/mapping/multi-field-type.html

HTH

答案 1 :(得分:0)

您可以将自己的分析器与keyword tokenizerword delimiter token filter一起使用(选项generate_word_partspreserve_original设置为true