我们正在努力将Solr的实施扩展到国际市场。 mapping-ISOLatin1Accent.txt
仅支持每个重音字符一个映射。例如:ä => a
。不过,我们想要映射ä => a
和ae
。有没有办法将1个带重音的字符映射到现有ISO映射中的多个非重音表示,还是需要自定义映射器?
由于
答案 0 :(得分:0)
这感觉有点像重新发明一辆自行车。如果您打算与国际市场打交道,请从使用简单映射切换到使用ICU Unicode Mapping。
Solr完全支持Unicode规范化,分解和映射组件(search for those starting from ICU)。这需要一些探索,但非常值得。