我使用Lucene进行拼写检查操作。但它并没有索引2个字母的单词。这似乎是关于Lucene拼写检查的常见问题。
这是我的索引方法:
String fileName = "words.txt";
Dictionary dictionary = null;
try {
BufferedReader bufferedReader = new BufferedReader(new InputStreamReader(new FileInputStream(new File(fileName)), "UTF-8"));
dictionary = new PlainTextDictionary(bufferedReader);
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
} catch (FileNotFoundException e) {
e.printStackTrace();
}
SpellChecker spell = null;
try {
Directory directory = FSDirectory.open(spellCheckerPath);
spell = new SpellChecker(directory);
spell .setAccuracy(0.5f);
} catch (IOException e) {
e.printStackTrace();
}
IndexWriterConfig indexWriterConfig = new IndexWriterConfig(Version.LUCENE_4_10_2, new StandardAnalyzer());
indexWriterConfig.setOpenMode(OpenMode.CREATE_OR_APPEND);
try {
spell.indexDictionary(dictionary, indexWriterConfig, true);
spell.close();
} catch (IOException e) {
e.printStackTrace();
}
现在,此方法适用于3个或更多字母单词。但是,它不能索引2个字母的单词。我读到了关于stopWords的内容。我试图将空的StopWords作为参数提供给StandardAnalyzer;但它没有用。 (另外,我试图用Luke搜索,它无法找到它)
我需要使用4.10.2版本的Lucene。我感谢任何帮助。