我们有一个充满OCR数据和手动输入数据的数据库。
使用CONTAINS命令进行搜索时,并非所有结果都出现。所以搜索“猴子男人”不会返回数据中有m0nkey man,momkey man的记录。
有没有办法在数据中考虑这些问题?
我粗略地看了一眼Lucene.NET和Soundex,但看不出这些有多大用处。
感谢您的任何想法
答案 0 :(得分:5)
我相信你正在寻找一种叫做模糊匹配的东西。
类似的帖子:
也许有用:
http://web.archive.org/web/20100209050309/http://anastasiosyal.com/archive/2009/01/11/18.aspx