我试图在elasticsearch中找到一个用空格替换所有空格并将多个单词转换为单个单词的标记化器。
例如:Abd al Qadir ===> Abdalqadir
答案 0 :(得分:0)
实现这一目标的方法是使用pattern_replace
过滤器创建自定义过滤器,并使用该过滤器和lowercase
过滤器创建自定义分析器。
以下是配置结果的示例:
"settings": {
"index": {
"analysis": {
"filter": {
"whitespace_remove": {
"type": "pattern_replace",
"pattern": " ",
"replacement": ""
}
},
"analyzer": {
"my_analyzer": {
"filter": [
"lowercase",
"whitespace_remove"
],
"type": "custom",
"tokenizer": "keyword"
}
}
}
}
}