目前我们正在评估模糊搜索的一系列选项。 我们的一个要求是匹配错误的单词。 CRA1G的OCR(编号为1)必须与'CRAIG'匹配。
sql server中的全文搜索似乎接近了,但没有雪茄。
除了'FORMSOF(Inflection,CRA1G)'之外,是否有一些选项可以替代这些类型的不匹配并仍能获得结果?
我无法找到任何类似的东西SOUNDEX绝对不够好。
接下来我可能会尝试使用Lucene,它具有良好的模糊搜索功能。
此致
克雷格。
答案 0 :(得分:3)
SQL Server 2008支持这些词汇应该可以帮助您到达所需的位置。您可以将拼写错误定义为同义词。见http://msdn.microsoft.com/en-us/library/ms142491.aspx。
编辑: 据我所知,你不能使用通配符或正则表达式方法。您必须为您预期最常被误输入的单词定义常见的替换集模式。
答案 1 :(得分:2)
这可能对您没有帮助,但我们对名称有这个问题。在德语中,有很多类似的名字:拜耳,拜尔,拜尔都听起来都一样。为此,我们使用phonetic spelling创建了一个单独的列。你可能会为你的模糊创建一个类似的字母表,其中“I”等于“1”,并得到类似的结果。