我使用自定义分析器/标记器组合创建了Lucene索引。标记化器将CharTermAttribute(尽管值只是很多数字)和OffsetAttribute添加到索引中。 (如果您有一个提示如何存储数字和偏移而不使用CharTermAttribute,那将非常棒,我觉得这有点不好;))
现在我想通过考虑相应术语的偏移来查询该索引。即第一个偏移是无关紧要的,但之后的后续术语应该匹配相同的顺序,就像PhraseQuery一样。在以后的版本中,应允许值稍微偏离。我知道这可以使用TermRangeQuery来完成。但是我仍然有点无法理解如何将这两者结合起来实现我想要的目标。
您能给我一个提示,告诉我实施哪个界面以及在哪里找到所需信息?在深入研究Lucene源代码之前,我觉得最好问一下......