使用Lucene搜索不同组合的名称

时间:2013-11-26 18:56:23

标签: sql search solr lucene

我们有一个基于asp.net Web的应用程序,它需要从大型名称数据库中搜索名称,该数据库大约有200万个名称。这也是我们要求它实时完成的。我们搜索并发现Lucene可以快速搜索。我们在交易中有名称可以是不同的顺序,也可以是完整名称的一部分,也可能是错误的拼写。用户可以选择提供所需的匹配精度百分比。我们使用SQL Server 2008 R2数据库。如果任何用户具有类似要求的经验,请感谢您的反馈/解决方案。

此致

1 个答案:

答案 0 :(得分:0)

对于我来说,这看起来像是一个完整的企业商业项目,其中包含您在此处提出的要求,而不是Lucene技术问题。是的,Lucene可以解决这个问题。您需要编写具有重叠可变长度char-gram索引的特殊标记生成器,并将这些n-gram索引到lucene“文档”。在查询阶段,您需要将输入名称分解为n-gram字符并搜索Lucene。