最近单词的最佳算法是什么

时间:2010-08-30 19:56:13

标签: algorithm

最近单词的最佳算法是什么。

给出了可能的单词字典,输入单词中的第一个字符可能是错误的。

3 个答案:

答案 0 :(得分:7)

一个选项是BK树 - 请参阅我的博客文章here。另一个更快但更复杂的选择是Levenshtein Automata,我也写过,here

答案 1 :(得分:4)

有一些工具,例如HunSpell(广泛包括OpenOffice的开源拼写检查程序),它从多个角度处理了这个问题。决定单词接近程度的一个广泛使用的标准是Levenshtein distance,它也在HunSpell中使用。

答案 2 :(得分:3)

您可以使用BLAST

并修改它以使用字典中的单词是离散单位这一事实,这使得匹配过程比长DNA链更具特异性。

BLAST已经内置了编辑距离的概念。

或者,您可以使用后缀树(Dan Gusfeld有一本关于基本字符串匹配算法的优秀书籍)并构建了编辑距离的想法。