我们有一个基于asp.net Web的应用程序,它需要从大型名称数据库中搜索名称,该数据库大约有200万个名称。这也是我们要求它实时完成的。我们搜索并发现Lucene可以快速搜索。我们在交易中有名称可以是不同的顺序,也可以是完整名称的一部分,也可能是错误的拼写。用户可以选择提供所需的匹配精度百分比。我们使用SQL Server 2008 R2数据库。如果任何用户具有类似要求的经验,请感谢您的反馈/解决方案。
此致
答案 0 :(得分:0)
对于我来说,这看起来像是一个完整的企业商业项目,其中包含您在此处提出的要求,而不是Lucene技术问题。是的,Lucene可以解决这个问题。您需要编写具有重叠可变长度char-gram索引的特殊标记生成器,并将这些n-gram索引到lucene“文档”。在查询阶段,您需要将输入名称分解为n-gram字符并搜索Lucene。