搜索段落和段落

时间:2014-12-12 04:24:39

标签: java .net regex algorithm data-structures

我正在尝试开发一个功能,该功能将根据搜索关键字突出显示页面中的文本。我有页面中所有单词的边界框,所有单词都根据其外观按升序排列。

搜索应该支持字符串文字搜索和正则表达式。

我认为使用尝试的一个选项。看起来它对字符串文字搜索很有用,而且如果搜索要突出显示一个或多个独立的单词。此处也无法处理正则表达式。但是一旦构建了尝试,那么搜索时间与关键字匹配就非常有效。

另一种选择是将页面的所有单词连接成单个字符串。然后还将单词索引到其边界框。然后在大字符串上使用平台的搜索功能。这是非常简单的设计,但效率不高。但也支持正则表达式。

对此的任何建议都非常感谢。

0 个答案:

没有答案