人名搜索的Solr语音算法

时间:2017-03-03 14:37:05

标签: solr

我是Solr的新手,并尝试在我们的项目中使用Solr for Person搜索。人员记录,包括姓名,出生日期,性别和地址等字段。我们尝试使用各种模糊滤波器和语音滤波器来检索人员记录并获得不错的结果。

对于语音算法,我们使用的是Beider Morse语音算法,它比我们迄今为止尝试的其他算法要好。我想知道是否有人将Solr非常专门用于人物搜索,请您分享一下您用于名称匹配的语音算法的经验以及对这些算法的任何比较研究。

非常感谢

1 个答案:

答案 0 :(得分:0)

名称匹配是Solr的一个常见用例,所以我确信有很多人都有这方面的经验。

但我不认为选择最好的拼音过滤器就足够了。无论您需要根据具体情况自定义它。例如:

  • 除了姓名/姓氏等,我通常还会遇到其他领域(国籍,年龄,性别......)。你也这样做。您通常将这些用作fq或仅用于提升。
  • 假阳性或假阴性同样不好或者一个不如另一个严重?
  • 您的语料库是否包含单一语言,或者名称可以来自世界上任何地方?

然后继续。 Basis有一个商业产品,我想你可以在Lucene / Solr革命2015上看到这个主题的their presentation