爵士拼写检查显示正确的拼写单词拼写错误

时间:2016-01-11 15:47:26

标签: java spell-checking jazzy

我已经在我的项目中实现了爵士拼写检查程序,并且它正在工作但我正在接受许多假阴性;拼写正确的单词显示为拼写错误。

我按如下方式构建我的字典对象:

public SpellDictionaryHashMap getTempDictMap(){
        //String sDictionaryPath =     "C:/jason/code/libraries/jazzy/dictionary/eng_com.dic";
        String sDictionaryPath =     "C:/jason/code/libraries/jazzy/dictionary/English (USA).dic";
        String sPhoneticPath = "C:/jason/code/libraries/jazzy/dictionary/phonet.en";

    SpellDictionaryHashMap dictionary = null;
    try {
        dictionary = new SpellDictionaryHashMap(new File(sDictionaryPath), new File(sPhoneticPath));
    } catch (FileNotFoundException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    } catch (IOException e) {
        // TODO Auto-generated catch block
        e.printStackTrace();
    }

    return dictionary;
}

我一直在寻找不同的词典,我收集jazzy喜欢每行格式的一个单词。我尝试过jazzy下载附带的eng_com.dic,并为其他人搜集。

似乎一些假想的拼错单词都在字典中......不确定是什么问题。

不应列为拼写错误的单词的一些示例是:

INFO  SpellCheckProcess - word : determination
INFO  SpellCheckProcess - word : graduate
INFO  SpellCheckProcess - word : based
INFO  SpellCheckProcess - word : completed

这只是找一本好字典的问题吗?或者在最初创建对象后添加几个然后添加单词?

我还有一堆字典,其中的单词一起输入。我认为那些是aspell词典? (前一段时间下载了这个东西)那些不适用于爵士乐?

之前有人遇到过这个问题并有一个很好的方法来处理它吗?

感谢, bp的

2 个答案:

答案 0 :(得分:1)

来自文章http://coldfusion.sys-con.com/node/42120

  

字典文件是每行一个单词,区分大小写的正确拼写单词列表,您希望拼写检查程序对其进行验证。在区分大小写的字母顺序中,以大写字母开头的所有单词都以小写字母开头(津巴布韦将在aardvark之前出现)。

查看eng_com.dic文件,它不是按顺序排列的......它按字母长度按递增顺序排序。另请注意,根据文件english.txt,您需要合并多个文件才能获得完整的字典(尽管您列出的字词都在eng_com.dic中)。

答案 1 :(得分:0)

不是拼写检查程序的问题。根据上面的评论,字词如:

graduates”

正在绊倒拼写检查程序