Solr - 自定义片段

时间:2013-03-26 11:08:53

标签: regex highlighting solr4

我想在我的solr突出显示功能中使用Regexp Fragmenter来自定义我的片段。

根据要求,我们需要在突出显示术语之前和之后返回25个单词。

以下是一个高亮片段示例。

Some polls show a major gender gap between men and women when it comes to gun control. A Washington Post/ABC News poll in January showed that <span class="highclass">women</span> supported a semi-automatic gun ban by 20 more points than men. They favored a ban on high-capacity magazines by 15 points.

为此,我在正则表达式下做了

((?:\w+\W*){25})\b(span class)\b((?:\W*\w+){25})

这个正则表达式与简单字符串一起正常工作。 (已测试),但在使用solr时,它似乎无法正常工作。

很少有亮点会好起来,但是对于一些亮点来说,突出显示术语是突出显示片段的开始。

我不确定,regexp fragmenter可以做什么,我需要什么。还有其他方法可以满足这一要求。

有人可以就此提出建议吗?

1 个答案:

答案 0 :(得分:0)

Possessive Quantifier (额外的&#34; +&#34;)可以解决问题:

((?:\w++\W*+){25})\b(span class)\b((?:\W*+\w++){25})