将HTML文件转换为PDF

时间:2013-07-12 11:10:24

标签: java html pdf-generation

我使用以下代码生成HTML报告的PDF文件

String url = new File("Test.html").toURI().toURL().toString();
OutputStream os = new FileOutputStream("Test.pdf");
ITextRenderer renderer = new ITextRenderer();
renderer.setDocument(url);
renderer.layout();
renderer.createPDF(os);
os.close();

我能够在示例HTML文件上使用它来转换为pdf。但就我的实际使用情况而言,HTML内容包含各种特殊符号,例如&,<,>无法解析的 XML

我尝试使用CDATA,同时生成HTML本身,但后来发现CDATA周围的文字在HMTL中不可见。

有人有解决方案吗?

2 个答案:

答案 0 :(得分:0)

您是否尝试过从浏览器打印到pdf?谷歌primo pdf的程序,我们会让你这样做。

答案 1 :(得分:0)

我不知道这是否对您有所帮助,但您可以使用StringEscapeUtils中的apache-commons。它具有转义方法和unescape HTML(您可以使用它们在HTML代之前预处理PDF