Lucene Spans
个对象有startPosition()
和endPosition()
个方法,根据他们Javadoc返回当前文档中的位置[s]。这些有用吗?
我的理解是这些位置是Analyzer
处理原始文本后跨度索引的开始和结束标记的索引。但是在挖掘Javadocs一段时间之后,我不知道我能用这些位置做些什么。看起来我应该能够查询文档,比如说,在startPosition
和endPosition
之间获取令牌,或者可能获得对应于这些位置的offset
,但我不知道看到这样的事情。
如何将这些位置与原始文本联系起来?