Solr - 从关键字中获取上一个/下一个X数量的单词

时间:2012-07-30 21:42:04

标签: regex search solr

有没有办法查询关键字并获取前一个x数量的单词和下一个x数量的单词?

实施例

(搜索“测试”)

Aa bb cc dd ee ff gg hh ii jj kk ll Test mm nn oo pp qq rr ss tt ...

其中x为5将返回

“hh ii jj kk ll Test mm nn oo pp qq rr ss”

突出显示“测试”。

(搜索“测试”和/或“垃圾邮件”)

Aa bb cc dd ee ff gg hh ii jj kk ll Test mm nn Spam oo pp qq rs ss tt tt tt ...

其中x为5将返回

“hh ii jj kk ll Test mm nn Spam oo pp qq rr ss tt”

突出显示“测试”和“垃圾邮件”。

非常感谢任何帮助。我一直在研究Regex,但我在那里很无能为力。这是我一直在使用的资源。另外,我包含$,。和其他随机标点符号(尝试通过句子进行隔离)。我们假设要分开的空格。

http://lucidworks.lucidimagination.com/display/solr/Highlighting#Highlighting-UsingBoundaryScannerswiththeFastVectorHighlighter

http://wiki.apache.org/solr/HighlightingParameters/

谢谢!

1 个答案:

答案 0 :(得分:0)

使用突出显示工具 - 它将为您提供匹配文档的片段,并使用斜体(HTML格式)搜索术语。然后你可以在那些标记(<em>)上居住,然后逐个字符地前后移动,直到你累积五个空格字符。