我想在我的solr突出显示功能中使用Regexp Fragmenter来自定义我的片段。
根据要求,我们需要在突出显示术语之前和之后返回25个单词。
以下是一个高亮片段示例。
Some polls show a major gender gap between men and women when it comes to gun control. A Washington Post/ABC News poll in January showed that <span class="highclass">women</span> supported a semi-automatic gun ban by 20 more points than men. They favored a ban on high-capacity magazines by 15 points.
为此,我在正则表达式下做了
((?:\w+\W*){25})\b(span class)\b((?:\W*\w+){25})
这个正则表达式与简单字符串一起正常工作。 (已测试),但在使用solr时,它似乎无法正常工作。
很少有亮点会好起来,但是对于一些亮点来说,突出显示术语是突出显示片段的开始。
我不确定,regexp fragmenter可以做什么,我需要什么。还有其他方法可以满足这一要求。
有人可以就此提出建议吗?
答案 0 :(得分:0)
Possessive Quantifier (额外的&#34; +&#34;)可以解决问题:
((?:\w++\W*+){25})\b(span class)\b((?:\W*+\w++){25})