如何在Lucene 5.2.x中为短语建议实现拼写检查算法?

时间:2015-08-18 22:25:57

标签: java lucene nlp spell-checking

我正在使用Lucene拼写检查程序进行拼写纠正。虽然程序返回类似的单词,但它并不是我想要的。有关如何获取短语而不是单词的任何建议。我有一个文本文件,每行一个句子被索引,我希望程序纠正拼写并返回整行,而不是类似于搜索查询的单词。

以下是我所做的代码摘要:

    Analyzer analyzer = new StandardAnalyzer();
    IndexWriterConfig iwc = new IndexWriterConfig(analyzer);
    IndexReader reader = DirectoryReader.open(directory);

    SpellChecker spellChecker = new SpellChecker(directory);
    spellChecker.indexDictionary(new LuceneDictionary(reader, "contents"), iwc, true);

    int numofsuggestions = 10;

    String[] suggestions = spellChecker.suggestSimilar(query, numofsuggestions);

0 个答案:

没有答案