我需要开发一个应用程序来索引几个文本,我需要在这些文本中搜索人的名字。问题是,虽然一个人的正确名称是“格雷戈里杰克逊少年”,但在文本中,这个名字可能写成:
- Greg Jackson Jr
- Gegory Jackson Jr
- 格雷戈里杰克逊
- Gregory J. Junior
我计划在每晚的基础上索引文本并构建数据库索引以加速搜索。我想推荐关于这个主题的好书和/或好文章
感谢
答案 0 :(得分:2)
答案 1 :(得分:2)
你的问题是错误的措辞。这些示例并未表示拼写错误,而是以书写全名的形式进行更改。
而且,
好的,阅读你的评论表明你不想冒险进入。
答案 2 :(得分:1)
记录。使用贝叶斯过滤器。您可以使用机械卡车来初始化算法。