我在文本文件中有一个单词列表。我想要的是输入单词与输入单词类似的单词列表。因此,该程序应该类似于拼写检查器API,只有字典仅限于我的单词列表。
如果我得到一些拼写检查算法或正则表达式的指针,我可以编写自己的代码。
感谢您的帮助, 巴尔克里希纳
答案 0 :(得分:2)
看看Apache Commons Lang StringUtils.getLevenshteinDistance
。 Levenshtein算法给出了两个单词之间的“编辑距离”,即它们的相似程度。它们的实现速度非常快 - 我在网上找到的另一个实现测试它,如果我没记错的话,速度提高了1/3。
答案 1 :(得分:2)
我强烈建议您查看Peter Norvig关于How to Write a Spelling Corrector的文章。值得一读。它并没有太多的复杂性。如果向下滚动页面,则可以看到Java实现的链接。然后,您可以根据自己的需要进行自定义。
答案 2 :(得分:0)