使用荧光笔和完整性的问题。

时间:2011-12-16 14:43:02

标签: java lucene full-text-search

现在我遇到了一个问题。 贝娄是我写的索引的内容,

was written for a formula, it's written as this, indeed.[latxt]$$ \left( {a + b} \right)\left( {{1 \over a} + {1 \over b}} \right) \ge \left( {a \cdot {1 \over a} + b \cdot {1 \over b}} \right)^2  = 4 $$[/latxt] was written for a formula, it's written as this, indeed.

当我在b上搜索1 \时,使用荧光笔的SimpleFragmenter来控制荧光笔内容的长度。结果只是部分代码。

   {1 \over a} + b \cdot {<em>1 \over b</em>}} \right)^2

但我真正想要的是[latxt]标记的全部内容,然后将其编译成图片。

我正在考虑的方法如下:

  • 如果有[latxt]标记,请不要使用荧光笔,只需将其编译成图片,然后根据术语的偏移量获得一些句点。但这种方法不够准确。
  • 要自己实现Fragmenter,完全处理有[latxt]标记的内容,因为我仍然无法掌握Fragmenter,也许这种方法不太可能选择。

所以,老实说,我希望你能告诉我一些更方便,更容易实现的方法。

1 个答案:

答案 0 :(得分:0)

您需要使用具有位置和偏移的TermVectors。 This帖子解释了如何。