我希望获得一个用于html的C ++解析器,但似乎只有c ++的xml解析器,各种来源暗示了XML解析器可以解析HTML的事实,但我无法找到任何具体的信息XML分析可以解析HTML。
如果您可以用它解析HTML,为什么如果他们使用不同的语言,这是可能的,而且我不认为html是XML的子集?
答案 0 :(得分:2)
可以使用XML解析器解析某些HTML;一些HTML不能。
SGML生成XML和HTML。 SGML和HTML并不像XML那样普遍要求关闭标记(以及其他差异),因此在一般情况下不能通过XML解析器进行解析。另一方面,XHTML根据定义是格式良好的XML,因此可以通过XML解析器进行解析。