Lucene SpellCheck没有索引2个字母单词

时间:2016-02-16 09:36:51

标签: java lucene spell-checking

我使用Lucene进行拼写检查操作。但它并没有索引2个字母的单词。这似乎是关于Lucene拼写检查的常见问题。

这是我的索引方法:

    String fileName = "words.txt";

    Dictionary dictionary = null;
    try {
        BufferedReader bufferedReader = new BufferedReader(new InputStreamReader(new FileInputStream(new File(fileName)), "UTF-8"));
        dictionary = new PlainTextDictionary(bufferedReader);
    } catch (UnsupportedEncodingException e) {
        e.printStackTrace();
    } catch (FileNotFoundException e) {
        e.printStackTrace();
    } 

    SpellChecker spell = null;
    try {
        Directory directory = FSDirectory.open(spellCheckerPath);
        spell = new SpellChecker(directory);
        spell .setAccuracy(0.5f);
    } catch (IOException e) {
        e.printStackTrace();
    }

    IndexWriterConfig indexWriterConfig = new IndexWriterConfig(Version.LUCENE_4_10_2, new StandardAnalyzer());
    indexWriterConfig.setOpenMode(OpenMode.CREATE_OR_APPEND);
    try {
        spell.indexDictionary(dictionary, indexWriterConfig, true);
        spell.close();
    } catch (IOException e) {
        e.printStackTrace();
    }

现在,此方法适用于3个或更多字母单词。但是,它不能索引2个字母的单词。我读到了关于stopWords的内容。我试图将空的StopWords作为参数提供给StandardAnalyzer;但它没有用。 (另外,我试图用Luke搜索,它无法找到它)

我需要使用4.10.2版本的Lucene。我感谢任何帮助。

0 个答案:

没有答案