我的一些文档包含“ - ”em dash,我想用“ - ”和短划线替换它。从我在elasticsearch https://www.elastic.co/guide/en/elasticsearch/reference/current/analysis-pattern-replace-charfilter.html中读到的内容,我可以使用一个使用正则表达式的模式替换。
这样的事情:
PUT my_index
{
"settings": {
"analysis": {
"analyzer": {
"my_analyzer": {
"tokenizer": "standard",
"char_filter": [
"my_char_filter"
]
}
},
"char_filter": {
"my_char_filter": {
"type": "pattern_replace",
"pattern": "(\\d+)-(?=\\d)",
"replacement": "$1_"
}
}
}
}
}
我应该在模式和替换中指定什么?或者是否有任何其他方法可以将“ - ”em dash替换为弹性搜索中的“ - ”和短划线,然后在所有文档中替换模式匹配。任何帮助将不胜感激。