识别文本中拼写错误的名称的算法

时间:2009-06-25 14:13:10

标签: algorithm string search nlp

我需要开发一个应用程序来索引几个文本,我需要在这些文本中搜索人的名字。问题是,虽然一个人的正确名称是“格雷戈里杰克逊少年”,但在文本中,这个名字可能写成: - Greg Jackson Jr
- Gegory Jackson Jr
- 格雷戈里杰克逊 - Gregory J. Junior
我计划在每晚的基础上索引文本并构建数据库索引以加速搜索。我想推荐关于这个主题的好书和/或好文章 感谢

3 个答案:

答案 0 :(得分:2)

答案 1 :(得分:2)

你的问题是错误的措辞。这些示例并未表示拼写错误,而是以书写全名的形式进行更改。

而且,

好的,阅读你的评论表明你不想冒险进入。

答案 2 :(得分:1)

记录。使用贝叶斯过滤器。您可以使用机械卡车来初始化算法。