我可以添加一些根据Levenshtein距离为2或类似的东西创建拼写错误,或者反向工程Norvig's article on spellchecking。
但是,拼写错误最常见的方法是什么?
有人写了一个方法吗?
答案 0 :(得分:2)
没有普通的拼写错误生成算法,因为这种算法依赖于目标语言和应用程序 - 即生成垃圾邮件域,您基本上需要应用以下策略(使用meta.stackoverflow.com作为示例):< / p>
如果要更换字符,我们至少可以有两种情况:
希望这会有所帮助..