我试图在ubuntu上将一些HTML文件转换为XML格式,并且它们应该符合特定的XML架构或DTD。我想Tidy应该这样做,但我不理解它的语法。或者如果还有其他工具,我很乐意尝试一下。
例如:将file.htm
转换为file.xml
(符合standard.DTD
)
感谢
答案 0 :(得分:1)
Tidy可以将HTML转换为XHTML(元素和属性的结构相同,但符合XML格式良好的规则),但它无法将其转换为满足某些任意DTD的要求。
您需要在两种数据格式之间编写显式映射。 XSLT是一种流行的语言。