在文本中搜索单词以查找包含最匹配变体的文本

时间:2012-01-14 14:21:12

标签: sql sql-server algorithm word fuzzy-comparison

我想找到一种方法从表中找到最合适的行,其中包含与我输入的单词最相似的单词。任何的想法? (我正在使用OCR,发现不完全相同的单词有时会将单词'specific'称为'spccific')

2 个答案:

答案 0 :(得分:1)

如果您使用的是Oracle,那么可以尝试使用UTL_MATCH之类的Levenshtein Distance来计算将一个字符串转换为另一个字符串的最小编辑次数。其他系统可能有类似的东西,或者你可以使用算法作为你自己的功能的起点。

答案 1 :(得分:0)

如果您使用的SQL引擎可以使用SOUNDEX功能(SQL Server)或SOUNDS LIKE(MySQL),也许可以使用它。