我有一个德语单词与变音符号,让我们说它是“läuft”。我的目标是创建一个分析器,最后生成三个令牌:“läuft”,“laeuft”和“lauft”。
我尝试过与 icu_normalizer , asciifolding 和 snowball for German2 过滤器的不同组合,但没有结果。我从 asciifolding 令牌过滤器中获得的最佳结果是发出三个必需令牌中的两个:“läuft”和“lauft”。
所以,基本上,我需要为德语创建某种自定义 asciifolding 过滤器,以便为带有变音符号的单词发出更多变体。
asciifolding 和 snowball 过滤器的配置如下:
"ascii2": {
"type": "asciifolding",
"preserve_original": "true"
},
"snow-german2": {
"type": "snowball",
"language": "German2"
},
我非常感谢您的帮助!