我是Lucene的新手。在理解它的过程中,我可以成功索引目录中的文件,并进行了基本的lucene搜索,以获取存在特定单词的文件列表。
现在我正试图从存在搜索词的文件中提取句子。 我搜索了很多,但无法弄清楚。
问候。
答案 0 :(得分:1)
谢谢大家的回复。
我试图提取文件目录中的句子索引而不是" relavent / best text / fragment"。
以下是我解决问题的方法:
使用"两级索引" - >首先索引目录中的文件&然后索引每个文件中的句子。这使我的工作变得更加容易和快点。
无论如何,再次感谢帮助:)
答案 1 :(得分:0)
您正在寻找方法
org.apache.lucene.search.highlight.Highlighter.getBestFragment
这种方法输入分析原始文本生成的令牌集,并在输出中返回最相关的文本片段。如果碎片太大,请记得修剪它们。