Solr - 对其他几个人进行角色搜索

时间:2014-02-07 12:09:22

标签: solr

我目前正在尝试使Solr索引很多库数据。例如,该库数据包含不同拼写的作者,以及本地字母(例如ä,ü,ø,ö等)。我希望我的用户可以搜索Østersøen并获得Österssöen, Østersøen等结果。

我的问题是,我如何使用Solr实现这一目标。在我看来,映射不会削减它,因为我希望一个字符可以算作其他几个。

u -> u, ü, ù, ú
å -> å, aa
ø -> ø, ö, o

反过来(有些人),所以

aa -> å

这是可能的,如果是这样的话?

2 个答案:

答案 0 :(得分:1)

查看提示here。基本上有两件事要做:

  1. 根据语言进行适当的词干/过滤
  2. ASCIIFoldingFilterFactory / ICUFoldingFilterFactory

答案 1 :(得分:0)

您需要Unicode折叠(ICUFoldingFilterFactory),它执行所有规范化。

您还希望以CJK问题作为重点阅读the whole 12 post series on the using Solr in the library。它可能会回答你甚至还没有的问题。最后,如果你还没有看过Project Blacklight,那么值得这样做。这是一个专门为图书馆使用Solr的人群,他们可能有共同的问题和解决方案。