如何将无效的XHTML网站保存为有效的XML

时间:2012-07-03 13:44:01

标签: html xml macos dom xhtml

有一个网站无效 XHTML(缺少一些结束标记)。

我想用XSLT处理它的内容,但是,我需要一个有效的XML输入。

是否可以将浏览器创建的DOM文档从无效的XHTML输入保存为有效的XML / XHTML?

2 个答案:

答案 0 :(得分:2)

是的。有几个库可以处理无效标记并将其作为有效的xml / xhtml返回。 其中一个是整洁的http://tidy.sourceforge.net/

如果您有权访问该网站,您可以将输出打印到缓冲区然后清理它...... BTW:有效的xhtml也是有效的xml。

答案 1 :(得分:1)

如果您使用.NET作为服务器端技术,则可以尝试Html Agility Pack。 它可以加载无效的HTML / XHTML并将其转换为有效的XML。