标签: c++ regex qt html-parsing
我有一个html文件池,想要搜索相同的目标文本。只需在忽略所有html标签,标题,脚本等的情况下搜索其文本内容
我尝试了Qt中的正则表达式QRegExp,但找不到一个好的模式来做我想要的事情。
我很感激这方面的任何帮助。
谢谢。
答案 0 :(得分:0)
这对您来说可能是一个很好的答案,但您是否考虑过使用DOM解析器?这将消除过滤掉什么是文本以及什么是HTML标记的需要。遗憾的是,我不能为C ++推荐一个好的。