如何将HTML转换为XML(符合XML架构或DTD)

时间:2017-08-14 12:18:34

标签: html xml ubuntu dtd tidy

我试图在ubuntu上将一些HTML文件转换为XML格式,并且它们应该符合特定的XML架构或DTD。我想Tidy应该这样做,但我不理解它的语法。或者如果还有其他工具,我很乐意尝试一下。 例如:将file.htm转换为file.xml(符合standard.DTD) 感谢

1 个答案:

答案 0 :(得分:1)

Tidy可以将HTML转换为XHTML(元素和属性的结构相同,但符合XML格式良好的规则),但它无法将其转换为满足某些任意DTD的要求。

您需要在两种数据格式之间编写显式映射。 XSLT是一种流行的语言。