Question

我在网上找不到任何关于如何从Lucene文档中获取第一个匹配字符子序列的stackoverflow信息。

ATM我正在使用此逻辑从Lucene检索结果：

        Document doc=searcher.doc(hit.doc);
        String text=doc.get("text");
        if (text.length() > 80){
            text=text.substring(0,80);
        }
        results.add(new SearchResult(doc.get("url"), doc.get("title"), text));

正如您所看到的，这只是获取搜索文本的前80个字符，并将其与其他一些数据一起包装到SearchResult对象中。

以某种方式可以检索实际包含任何搜索字符的文本的第一个甚至最高评分子序列吗？

Answer 1

您需要Lucene Highlighter。 Here和here您可以找到更多信息。

Answer 2

它被称为hit highlighter。这可能是another highlighter question

的副本

Apache Lucene：如何从Document获取第一个匹配的子字符串

2 个答案: