我正在使用Lucene拼写检查程序进行拼写纠正。虽然程序返回类似的单词,但它并不是我想要的。有关如何获取短语而不是单词的任何建议。我有一个文本文件,每行一个句子被索引,我希望程序纠正拼写并返回整行,而不是类似于搜索查询的单词。
以下是我所做的代码摘要:
Analyzer analyzer = new StandardAnalyzer();
IndexWriterConfig iwc = new IndexWriterConfig(analyzer);
IndexReader reader = DirectoryReader.open(directory);
SpellChecker spellChecker = new SpellChecker(directory);
spellChecker.indexDictionary(new LuceneDictionary(reader, "contents"), iwc, true);
int numofsuggestions = 10;
String[] suggestions = spellChecker.suggestSimilar(query, numofsuggestions);