我有一个任意的XHTML文档,通常没有很好的形成,因为网站可以这样制作,浏览器会显示它。如何针对格式不正确的XHTML代码支持XSLT转换?有没有办法可以避免那些形状不好的部分?
我在Java中使用此代码,但正如我所说,它不支持不良的XHTML:
try {
TransformerFactory tFactory=TransformerFactory.newInstance();
Source xslDoc=new StreamSource("path1");
Source xmlDoc=new StreamSource("path2");
String outputFileName="path3";
OutputStream htmlFile=new FileOutputStream(outputFileName);
Transformer trasform=tFactory.newTransformer(xslDoc);
trasform.transform(xmlDoc, new StreamResult(htmlFile));
}
catch (Exception e) {...}
答案 0 :(得分:2)
您可以使用JSoup库来解析和修复HTML,然后使用XSLT。
答案 1 :(得分:1)
您可以尝试使用像http://about.validator.nu/htmlparser/这样的HTML解析器,也可以尝试使用TagSoup。