如何在java中找到数据库中类似的单词匹配

时间:2013-04-30 08:01:00

标签: java regex string-comparison

我有一个没有正确发音的单词列表,即智能手机发音为smartphon也是私有的私有。

所以我会将发音不佳的单词与包含正确单词的数据库进行匹配。怎么做。

我希望得到这个词并用正确的词替换这个词。

  poorwords                   rightword            

  privat                      private                


  capabl                       capable

  storag                       storage

  satisfi                      satisfy

如何做到这一点。他们的compareTo(String h)方法是否解决了我的问题?

2 个答案:

答案 0 :(得分:4)

要执行此操作,您需要一个有效单词的词典,然后使用Levenshtein distance对正在测试的单词与词典中的单词进行排名。

答案 1 :(得分:0)

您可以在Apache Commons'中找到用于计算 Levinshtein距离的Java库。 StringUtils.getLevenshteinDistance(CharSequence s, CharSequence t)