这种单词查找/拼写检查的最佳数据结构是什么?

时间:2014-09-13 23:16:42

标签: algorithm spell-checking trie spelling

我有一个单词列表,如:

mmad
mmaaddd
bbad
bbaadddd

假设根据某些字典,疯狂和坏的被认为是有效的单词。是否有任何理想的算法或数据结构来查找这些拼写错误的匹配?我当时认为trie会有用,但如果有效的单词列表/字典由数千个单词组成,我不确定如何发挥作用。

编辑:我应该提一下,我并不担心从角色的角度来消除这些词语,即我不想要" mmad"纠正到"悲伤"或类似的东西。我认为Levenshtein距离和LD距离会更好;这个问题很奇怪。

0 个答案:

没有答案