将XMLWorkerHelper与IText一起使用

时间:2013-02-21 16:24:10

标签: java pdf-generation itext

我是使用iText的新手,我无法弄清楚XMLWorkerHelper类是如何工作的。我正在尝试创建一个方法,该方法接受包含html文档的字符串,将html转换为pdf文档,并将pdf作为字节数组返回。如果有人可以在下面的代码中指出错误,我真的很感激。

Document document = new Document(); 
ByteArrayOutputStream baos = new ByteArrayOutputStream();
PdfWriter pdfWriter = PdfWriter.getInstance(document, baos);
document.open();
StringReader stringReader = new StringReader(articleString);
StringWriter stringWriter = new StringWriter();<br/>
Tidy tidy = new Tidy();
tidy.setXHTML(true);
tidy.parse(stringReader, stringWriter);
System.out.println("Before XMLWorkerHelper");
XMLWorkerHelper xwh = XMLWorkerHelper.getInstance();
xwh.parseXHtml(pdfWriter, document, new StringReader(stringWriter.toString()));
System.out.println("After XMLWorkerHelper");
document.close();
stringReader.close();
result = baos.toByteArray();

我正在使用的代码在上面。 html代码位于变量articleString中。重要的部分是两个System.out.println语句之间。这是Web应用程序的一部分,System.out会将任何错误或异常消息写入服务器日志,但发生的情况是,应用程序似乎终止而不会在两个println语句之间抛出任何异常。因此,“在XMLWorkerHelper之前”行打印,但不打印“After XMLWorkerHelper”行。

我正在使用的jar文件是itextpdf-5.4.0.jar,itext-pdfa-5.4.0.jar,itext-xtra-5.4.0.jar,xmlworker-5.4.0.jar

我正在尝试转换的html文件只是“Tester Article”,它正被jTidy转换为

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<title></title>
</head>
<body>
Tester Article
</body>
</html>

我尝试使用iText 5.0 jar中的旧HTMLWorker类代替XMLWorkerHelper代码,一切正常。我用来代替上面的XMLWorkerHelper行的HTMLWorker代码是:

HTMLWorker htmlWorker = new HTMLWorker(document);
htmlWorker.parse(new StringReader(stringWriter.toString()));

1 个答案:

答案 0 :(得分:0)

我希望这已经解决了。如果没有,请尝试删除代码。如果这没有帮助,请尝试将stringWriter.toString()放在InputStream中,然后在parseXHtml上使用该流代替stringWriter.toString()

的InputStream

InputStream stream = new ByteArrayInputStream(stringWriter.toString().getBytes("UTF-8"));

XMLWorkerHelper:

XMLWorkerHelper.getInstance().parseXHtml(pdfWriter, document, stream);

希望这可以帮助您或任何遇到同样问题的人