Question

在Lucene中获取术语周围的单词时，建议使用Span Queries。 http://lucidworks.com/blog/accessing-words-around-a-positional-match-in-lucene/

中有很好的演练

应该使用getSpans（）方法访问跨度。

SpanTermQuery fleeceQ = new SpanTermQuery(new Term("content", "fleece"));
Spans spans = fleeceQ.getSpans(searcher.getIndexReader());

然后在Lucene 4中，API发生了变化，getSpans（）方法变得更加复杂，最后，在最新的Lucene版本（5.3.0）中，此方法被删除（显然已移至SpanWeight类）。

那么，当前访问跨度项查询匹配的跨度的方法是什么？

Answer 1

这样做的方法如下。

LeafReader pseudoAtomicReader = SlowCompositeReaderWrapper.wrap(reader);
Term term = new Term("field", "fox");
SpanTermQuery spanTermQuery = new SpanTermQuery(term);
SpanWeight spanWeight = spanTermQuery.createWeight(is, false);
Spans spans = spanWeight.getSpans(pseudoAtomicReader.getContext(), Postings.POSITIONS);

通过span.next（）迭代跨度的支持在Lucene的5.3版本中也消失了。要迭代跨度，你可以做

int nxtDoc = 0;
while((nxtDoc = spans.nextDoc()) != spans.NO_MORE_DOCS){
  System.out.println(spans.toString());
  int id = nxtDoc;
  System.out.println("doc_id="+id);
  Document doc = reader.document(id);
  System.out.println(doc.getField("field"));
  System.out.println(spans.nextStartPosition());
  System.out.println(spans.endPosition());
}

如何在Lucene 5中获得Span Term Query的匹配范围？

1 个答案: