HTML到PDF转换 - “无法加载XML资源”错误

时间:2012-02-23 14:59:05

标签: java xhtml itext flying-saucer

我正在尝试使用飞碟和iText将严格的XHTML转换为PDF。我已经验证了XHTML,输入和输出文件的路径是精确的。我没有该死的线索,为什么这会在renderer.setDocument(“file:/ c:/example/First.html”)行上抛出异常。

我的班级:

package flyingsaucerpdf;
    import java.io.*;
    import org.xhtmlrenderer.pdf.ITextRenderer;
    import com.lowagie.text.DocumentException;

    public class FirstDoc {
     public static void main(String[] args) throws IOException, DocumentException
         {
                 String outputFile = "results/firstdoc.pdf";
                 OutputStream os = new FileOutputStream(outputFile);
                 ITextRenderer renderer = new ITextRenderer();
             try
             {
                 renderer.setDocument("file:/c:/example/First.html");
             }
             catch( Exception e )
             {
                 System.out.println("Me not create file. Error:"+e.getMessage());
             }
             renderer.layout();
             renderer.createPDF(os);

             os.close();
         }

    }

我的例外:

错误:''我不创建文件。错误:无法加载XML资源(使用TRaX转换器)。显示java.lang.NullPointerException

线程“main”java.lang.NullPointerException中的异常     在org.xhtmlrenderer.layout.BoxBuilder.createRootBox(BoxBuilder.java:81)     在org.xhtmlrenderer.pdf.ITextRenderer.layout(ITextRenderer.java:152)     at flyingsaucerpdf.FirstDoc.main(FirstDoc.java:31)

我的XHTML:

<?xml version="1.0" encoding="UTF-8" ?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta http-equiv="Content-Type" content="text/html; charset=UTF-8" />
<title>Insert title here</title>
<style type="text/css"> b { color: green; } </style>
</head>
<body>
<p>
<b>Greetings Earthlings!</b>
We've come for your Java.
</p>
</body>
</html>

有任何帮助吗?

1 个答案:

答案 0 :(得分:2)

您的虚拟机在线吗?渲染器/解析器可能会尝试加载链接的资源,如

  

http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd

确保您提供的xml(xhtml)正确无误。

在Servlet中,我执行以下操作似乎有效(某些在线资源在我自己的文件系统中可用,因为服务器没有互联网连接):

final DocumentBuilder builder = DocumentBuilderFactory.newInstance().newDocumentBuilder();
builder.setEntityResolver(new EntityResolver() {
  @Override
  public InputSource resolveEntity(String publicId, String systemId)
      throws SAXException, IOException {
    if (systemId.contains("xhtml1-transitional.dtd")) {
      return new InputSource(new FileReader(realPath + "/WEB-INF/dtd/xhtml1-transitional.dtd"));
    } else if (systemId.contains("xhtml-lat1.ent")) {
      return new InputSource(new FileReader(realPath + "/WEB-INF/dtd/xhtml-lat1.ent"));
    } else if (systemId.contains("xhtml-symbol.ent")) {
      return new InputSource(new FileReader(realPath + "/WEB-INF/dtd/xhtml-symbol.ent"));
    } else if (systemId.contains("xhtml-special.ent")) {
      return new InputSource(new FileReader(realPath + "/WEB-INF/dtd/xhtml-special.ent"));
    } else {
      return null;
    }
  }
});
final ByteArrayInputStream inputStream = new ByteArrayInputStream(html.getBytes("UTF-8"));
final Document doc = builder.parse(inputStream);
inputStream.close();
final ITextRenderer renderer = new ITextRenderer(26f * 4f / 3f, 26);
renderer.setDocument(doc, request.getScheme() + "://" + request.getServerName() + ":" + request.getServerPort());
renderer.layout();

这基本上设置了一个DocumentBuilder然后解析我的文档(它是String格式并由变量 html 表示)