我目前正在尝试使Solr索引很多库数据。例如,该库数据包含不同拼写的作者,以及本地字母(例如ä,ü,ø,ö等)。我希望我的用户可以搜索Østersøen
并获得Österssöen, Østersøen
等结果。
我的问题是,我如何使用Solr实现这一目标。在我看来,映射不会削减它,因为我希望一个字符可以算作其他几个。
u -> u, ü, ù, ú
å -> å, aa
ø -> ø, ö, o
但也反过来(有些人),所以
aa -> å
这是可能的,如果是这样的话?
答案 0 :(得分:1)
查看提示here。基本上有两件事要做:
答案 1 :(得分:0)
您需要Unicode折叠(ICUFoldingFilterFactory),它执行所有规范化。
您还希望以CJK问题作为重点阅读the whole 12 post series on the using Solr in the library。它可能会回答你甚至还没有的问题。最后,如果你还没有看过Project Blacklight,那么值得这样做。这是一个专门为图书馆使用Solr的人群,他们可能有共同的问题和解决方案。