Soundex给出了太多建议

时间:2016-12-10 14:29:30

标签: java algorithm soundex

所以我正在用Java编写一个小的拼写检查程序。该计划必须:

  1. 检查单词是否在" dictionary.txt"文件(包含88,000个单词)。
  2. 如果单词不在该词典中,请使用编辑距离/ Soundex算法获得一些建议。
  3. 提示用户 - 询问他们是否愿意用其中一个建议替换该词。
  4. 我发现的问题是,对于一个单词,我的Soundex实现可以返回20多个我放入ArrayList的建议。

    现在,当提示用户时,我发现在每个拼写错误中有20个不同的单词可供选择,这对用户不友好,我想稍微改进一下。但是我很难过。我不知道如何避免某些词 - 例如,如果用户输入" dawg"因为有些奇迹,他们不知道怎么拼狗,他们得到了大约80个建议可供选择。

    我考虑循环遍历我的ArrayList并显示如下建议:

    1. DAG
    2. 让用户输入1,2或3.然而,当建议数量相当高时,对用户来说这将是一项相当艰巨的任务。

      这是我使用的当前算法,它不是原始算法,但声称效果比原版更好:http://creativyst.com/Doc/Articles/SoundEx1/SoundEx1.htm#Algorithm

      因为这不是一个逻辑问题,而是一个编程问题,如果这不属于这里,请指出我正确的地方。

0 个答案:

没有答案