Lucene-提取单词匹配的句子

时间:2014-09-17 14:06:28

标签: lucene

我是Lucene的新手。在理解它的过程中,我可以成功索引目录中的文件,并进行了基本的lucene搜索,以获取存在特定单词的文件列表。

现在我正试图从存在搜索词的文件中提取句子。 我搜索了很多,但无法弄清楚。

问候。

2 个答案:

答案 0 :(得分:1)

谢谢大家的回复。

我试图提取文件目录中的句子索引而不是" relavent / best text / fragment"。

以下是我解决问题的方法:
    使用"两级索引" - >首先索引目录中的文件&然后索引每个文件中的句子。这使我的工作变得更加容易和快点。

无论如何,再次感谢帮助:)

答案 1 :(得分:0)

您正在寻找方法

org.apache.lucene.search.highlight.Highlighter.getBestFragment

这种方法输入分析原始文本生成的令牌集,并在输出中返回最相关的文本片段。如果碎片太大,请记得修剪它们。