假设我在Lucene中有100个索引的文档。我想搜索术语"美国航空公司"。 Lucene运行搜索并返回10个包含术语" American Airlines"的文档。我现在希望能够在我的UI中浏览这10个文档中的每一个,并自动突出显示/滚动到每个匹配项。这些都是具有唯一id-ed段落标记的html文档,因此我可以使用http://docurl#p_120
之类的内容滚动到<p id="p_120">American Airlines is a big company.</p>
。但是,我如何让Lucene告诉我该术语的哪个段落,以及它究竟在哪里,以便突出显示它?
答案 0 :(得分:0)
您的问题是关于突出显示。您询问如何使用子文档索引文本,以便您知道子文档的id以突出显示。
你有三种可能性。但首先让我提醒你,lucene可以使用偏移量(=原始文本中的位置)进行突出显示 https://lucene.apache.org/core/6_4_0/highlighter/org/apache/lucene/search/highlight/package-summary.html 并且lucene知道子文档的概念是“被阻止的子文档”或“嵌套文档”或“嵌入文档”。树的可能性: