使用Regex搜索HTML文件

时间:2011-04-03 19:26:40

标签: c++ regex qt html-parsing

我有一个html文件池,想要搜索相同的目标文本。只需在忽略所有html标签,标题,脚本等的情况下搜索其文本内容

我尝试了Qt中的正则表达式QRegExp,但找不到一个好的模式来做我想要的事情。

我很感激这方面的任何帮助。

谢谢。

1 个答案:

答案 0 :(得分:0)

这对您来说可能是一个很好的答案,但您是否考虑过使用DOM解析器?这将消除过滤掉什么是文本以及什么是HTML标记的需要。遗憾的是,我不能为C ++推荐一个好的。