iText将表格/复印页面填写到新文档

时间:2016-09-22 12:20:34

标签: java pdf itext7

我正在使用AcroForm填充包含com.itextpdf.io.IOException: PDF header not found.的模板PDF。 现在我想使用此模板创建一个包含动态页面的新PDF。 我的想法是填写模板PDF,使用书面字段复制页面并将其添加到新文件中。他们的主要问题是我们的客户希望自己设计模板。所以我不确定我是否尝试以正确的方式解决这个问题。

所以我创建了这段代码,现在无法正常工作,我收到错误 x = 1; try (PdfDocument finalDoc = new PdfDocument(new PdfWriter("C:\\Users\\...Final.pdf"))) { for (HashMap<String, String> map : testValues) { String path1 = "C:\\Users\\.....Temp.pdf" InputStream template = templateValues.get("Template"); PdfWriter writer = new PdfWriter(path1); try (PdfDocument pdfDoc = new PdfDocument(new PdfReader(template), writer)) { PdfAcroForm form = PdfAcroForm.getAcroForm(pdfDoc, true); for (HashMap.Entry<String, String> map2 : map.entrySet()) { if (form.getField(map2.getKey()) != null) { Map<String, PdfFormField> fields = form.getFormFields(); fields.get(map2.getKey()).setValue(map2.getValue()); } } } catch (IOException | PdfException ex) { System.err.println("Ex2: " + ex.getMessage()); } if (x != 0 && (x % 5) == 0) { try (PdfDocument tempDoc = new PdfDocument(new PdfReader(path1))) { PdfPage page = tempDoc.getFirstPage(); finalDoc.addPage(page.copyTo(finalDoc)); } catch (IOException | PdfException ex) { System.err.println("Ex3: " + ex.getMessage()); } } x++; } } catch (IOException | PdfException ex) { System.err.println("Ex: " + ex.getMessage()); }

我的代码

par(mfrow = c(1,2))

2 个答案:

答案 0 :(得分:4)

第1部分 - PDF标题缺失

这似乎是由于您尝试重新读取已经读取的循环中的InputStream(并且,取决于PdfReader的配置,已关闭)。解决这个问题取决于所使用的InputStream的特定类型 - 如果你想将它保留为一个简单的InputStream(相对于一个更具体但功能更强大的InputStream类型),那么你需要首先将来自流的字节从内存(例如ByteArrayOutputStream)然后根据这些字节创建PDFReaders。

ByteArrayOutputStream templateBuffer = new ByteArrayOutputStream();
while ((int c = template.read()) > 0) templateBuffer.write(c);
for (/* your loop */) {
    ...
    PdfDocument filledInAcroFormTemplate = new PdfDocument(new PdfReader(new ByteArrayInputStream(templateBuffer.toByteArray())), new PdfWriter(tmp))
   ...

第2部分 - 其他问题

一些事情

  1. 确保获取最近发布的iText 7.0.1版本,因为它包含了一些修复wrt / AcroForm处理
  2. 您可以使用ByteArrayOutputStreams来处理临时PDF(而不是将它们写入文件) - 我将在下面的示例中使用此方法
  3. PdfDocument / PdfPage位于“内核”模块中,但AcroForms位于“表单”模块中(意味着PdfPage故意不知道AcroForms) - IPdfPageExtraCopier是模块之间的桥梁。为了正确复制AcroForms,你需要使用两个arg copyTo()版本,传递一个PdfPageFormCopier实例
  4. 字段名称​​必须在文档中是唯一的(“绝对”字段名称 - 我现在将跳过字段级别)。由于我们循环并多次添加模板中的字段,因此我们需要提出一种策略来重命名字段以确保唯一性(当前API在这方面实际上有点笨拙)

    File acroFormTemplate = new File("someTemplate.pdf");
    Map<String, String> someMapOfFieldToValues = new HashMap<>();
    try (
        PdfDocument  finalOutput = new PdfDocument(new PdfWriter(new FileOutputStream(new File("finalOutput.pdf")));
    ) {
        for (/* some looping condition */int x = 0; x < 5; x++) {
            // for each iteration of the loop, create a temporary in-memory
            // PDF to handle form field edits.
            ByteArrayOutputStream tmp = new ByteArrayOutputStream();
            try (
                PdfDocument filledInAcroFormTemplate = new PdfDocument(new PdfReader(new FileInputStream(acroFormTemplate)), new PdfWriter(tmp));
            ) {
                PdfAcroForm acroForm = PdfAcroForm.getAcroForm(filledInAcroFormTemplate, true);
                for (PdfFormField field : acroForm.getFormFields().values()) {
                    if (someMapOfFieldToValues.containsKey(field.getFieldName())) {
                        field.setValue(someMapOfFieldToValues.get(field.getFieldName()));
                    }
                }
                // NOTE that because we're adding the template multiple times
                // we need to adopt a field renaming strategy to ensure field
                // uniqueness in the final document.  For demonstration's sake
                // we'll just rename them prefixed w/ our loop counter
                List<String> fieldNames = new ArrayList<>();
                fieldNames.addAll(acroForm.getFormFields().keySet()); // avoid ConfurrentModification
                for (String fieldName : fieldNames) {
                    acroForm.renameField(fieldName, x+"_"+fieldName);
                }
            }
    
            // the temp PDF needs to be "closed" for all the PDF finalization
            // magic to happen...so open up new read-only version to act as
            // the source for the merging from our in-memory bucket-o-bytes
            try (
                PdfDocument readOnlyFilledInAcroFormTemplate = new PdfDocument(new PdfReader(new ByteArrayInputStream(tmp.toByteArray())));
            ) {
                // although PdfPage.copyTo will probably work for simple pages, PdfDocument.copyPagesTo
                // is a more comprehensive copy (wider support for copying Outlines and Tagged content)
                // so it's more suitable for general page-copy use.  Also, since we're copying AcroForm
                // content, we need to use the PdfPageFormCopier
                readOnlyFilledInAcroFormTemplate.copyPagesTo(1, 1, finalOutput, new PdfPageFormCopier());
            }
        }
    }
    

答案 1 :(得分:0)

完成向其添加内容后关闭PdfDocuments。