如何使用c ++从HTML中提取文本?

时间:2010-08-31 02:14:05

标签: c++ html

如何使用c ++解析HTML标签?

例如:

<html><body>examlpe text </body></html>

1 个答案:

答案 0 :(得分:6)

最简单的选择是使用HTML解析库。 libxml2是一个可靠的开源软件,虽然它在技术上是一个C库。你需要加载你的html然后遍历DOM拉出所有的text()节点。我不知道我推荐这是你的第一个C ++任务。