Question

我是使用iText的新手，我无法弄清楚XMLWorkerHelper类是如何工作的。我正在尝试创建一个方法，该方法接受包含html文档的字符串，将html转换为pdf文档，并将pdf作为字节数组返回。如果有人可以在下面的代码中指出错误，我真的很感激。

Document document = new Document(); 
ByteArrayOutputStream baos = new ByteArrayOutputStream();
PdfWriter pdfWriter = PdfWriter.getInstance(document, baos);
document.open();
StringReader stringReader = new StringReader(articleString);
StringWriter stringWriter = new StringWriter();<br/>
Tidy tidy = new Tidy();
tidy.setXHTML(true);
tidy.parse(stringReader, stringWriter);
System.out.println("Before XMLWorkerHelper");
XMLWorkerHelper xwh = XMLWorkerHelper.getInstance();
xwh.parseXHtml(pdfWriter, document, new StringReader(stringWriter.toString()));
System.out.println("After XMLWorkerHelper");
document.close();
stringReader.close();
result = baos.toByteArray();

我正在使用的代码在上面。 html代码位于变量articleString中。重要的部分是两个System.out.println语句之间。这是Web应用程序的一部分，System.out会将任何错误或异常消息写入服务器日志，但发生的情况是，应用程序似乎终止而不会在两个println语句之间抛出任何异常。因此，“在XMLWorkerHelper之前”行打印，但不打印“After XMLWorkerHelper”行。

我正在使用的jar文件是itextpdf-5.4.0.jar，itext-pdfa-5.4.0.jar，itext-xtra-5.4.0.jar，xmlworker-5.4.0.jar

我正在尝试转换的html文件只是“Tester Article”，它正被jTidy转换为

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN"
"http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<title></title>
</head>
<body>
Tester Article
</body>
</html>

我尝试使用iText 5.0 jar中的旧HTMLWorker类代替XMLWorkerHelper代码，一切正常。我用来代替上面的XMLWorkerHelper行的HTMLWorker代码是：

HTMLWorker htmlWorker = new HTMLWorker(document);
htmlWorker.parse(new StringReader(stringWriter.toString()));

Answer 1

我希望这已经解决了。如果没有，请尝试删除代码。如果这没有帮助，请尝试将stringWriter.toString（）放在InputStream中，然后在parseXHtml上使用该流代替stringWriter.toString（）

的InputStream

InputStream stream = new ByteArrayInputStream(stringWriter.toString().getBytes("UTF-8"));

XMLWorkerHelper：

XMLWorkerHelper.getInstance().parseXHtml(pdfWriter, document, stream);

希望这可以帮助您或任何遇到同样问题的人

将XMLWorkerHelper与IText一起使用

1 个答案: