如何使用java将网页转换为xml文档?

时间:2009-12-14 10:08:38

标签: html xml dom xhtml

假设网站使用正确的标签进行编码。如何将其转换为XML文件?我认为大多数网页都可以被视为dom树...如何将其转换为XML文件?

1 个答案:

答案 0 :(得分:0)

JTidy读取HTML并将其显示为DOM。将HTML作为DOM后,您应该能够处理它并将其写为XML。

要输出DOM,请参阅example code here和特别是XMLSerializer。