使用c#中的itextsharp以pdf格式填充xml

时间:2013-12-26 00:01:19

标签: c# forms pdf itextsharp mergefield

我需要实现一种方法,将PDF中的字段与Adobe Life Cycle中创建的表单合并。 我将收到模板PDF和XML以填充PDF并需要返回新填充的文件。 xml是这样的:

 <?xml version="1.0" encoding="UTF-8"?>
<form1>
    <ReportDescription>
      <body xmlns="http://www.w3.org/1999/xhtml" xmlns:xfa="http://www.xfa.org/schema/xfa-data/1.0/">
              <p><span style="font:Arial bold 12px">Name of the document</span></p>
          </body>
    </ReportDescription>
    <ReportCode>XX-000</ReportCode>
   <Contents>
      <UserData>
              <UserName>Ego ille</UserName>
              <UserPhone>Si manu vacuas</UserPhone>
              <UserNIF>999999999</UserNIF>
      </UserData>
   </Contents>
</form1>

所以,我有以下内容:

private MemoryStream GeneratePDF(string m_FormName, XmlDocument oData)
        {
            PdfReader pdfTemplate;
            PdfStamper stamper;
            PdfReader tempPDF;
            Document doc;
            MemoryStream msTemp;
            PdfWriter pCopy;
            MemoryStream msOutput = new MemoryStream();

            pdfTemplate = new PdfReader(m_FormName);

            doc = new Document();
            pCopy = new PdfCopy(doc, msOutput);

            pCopy.AddViewerPreference(PdfName.PICKTRAYBYPDFSIZE, new PdfBoolean(true));
            pCopy.AddViewerPreference(PdfName.PRINTSCALING, PdfName.NONE);

            doc.Open();

            for (int i = 1; i < pdfTemplate.NumberOfPages + 1; i++)
            {
                msTemp = new MemoryStream();
                pdfTemplate = new PdfReader(m_FormName);

                stamper = new PdfStamper(pdfTemplate, msTemp);

                // map xml values to pdf form controls (element name = control name)
                foreach (XmlElement oElem in oData.SelectNodes("/form1/*"))
                {
                    stamper.AcroFields.SetField(oElem.Name, oElem.InnerText);
                }

                stamper.FormFlattening = true;
                stamper.Close();
                tempPDF = new PdfReader(msTemp.ToArray());
                ((PdfCopy)pCopy).AddPage(pCopy.GetImportedPage(tempPDF, i));
                pCopy.FreeReader(tempPDF);

            }
            doc.Close();

            return msOutput;
        }

1 个答案:

答案 0 :(得分:0)

您的问题有些误导:您谈论合并使用Adobe LiveCycle创建的表单。但是,当我查看您的代码时,我发现您实际上正在寻找合并普通PDF。请允许我解释一下。

使用Adobe LiveCycle创建的表单可能会产生两种类型的PDF文件。

  1. 包含PDF格式(AcroForm技术)形式的表单以及XML(XML Forms Architecture,又名XFA)的混合PDF文件。
  2. PDF文件,它们只是XML的容器。
  3. 可以使用核心iText库填写混合PDF文件。这在我的书的第8章中有解释。如果您展平这样的表单,则会丢弃XML并保留PDF语法。从那一刻起,您就拥有了普通的PDF文件。

    可以使用XFA Worker填写纯XFA表单。 XFA Worker是一个建立在iText之上的封闭源产品。它解析PDF容器中的XML并将这样的PDF转换为普通的PDF。

    根据您的问题,您不清楚您正在谈论哪种类型的Adobe LiveCycle表单,但由于您发布了有关它的问题,因此可以安全地假设你遇到了问题。查看您的代码,您假设您正在处理混合形式,如果该代码不起作用,我们反过来可以假设该形式是纯XFA形式。

    一旦您成功填写并展平表单,您确实可以使用PdfCopy,但根据表单的性质,您可能更愿意使用PdfSmartCopy(假设您是&#39;重新合并同一模板的不同实例。)

    这个答案基于很多假设。这解释了下来的投票和评论。

    例如:假设您确实要求合并两个XFA表单(在XML语法的两个PDF容器的意义上),那么您的问题是无法回答的。只有扁平化的表格才能合并。