如何使用perl将ZUGFeRD-XML附加到PDF?

时间:2016-11-23 07:58:02

标签: xml perl pdf pdflib

我需要创建一个附有XML的PDF / A 3b文档,就像在ZUGFeRD中声明的那样。为此我给自己写了一个perl脚本,它可以将XML文件创建为字符串并将其附加到PDF。我跟着tutorial of the pdflib-cookbook,但我从来没有让我的XML 100%附加到PDF。我在附件中看到它,我可以将它从那里保存到我的文件系统,但如果我用编辑器检查PDF,我只看到XMP-Metadata而不是我的XML。

我想我需要将XML作为嵌入式文件流或类似的东西附加,但我不确定我是否在代码中遗漏了某些内容,或者我只是需要以其他方式添加它。

这是我的XMP文件:

<!--

PDFlib GmbH 2013-2014

Sample ZUGFeRD XMP with the required PDF/A extension schema description
for the XMP properties of the ZUGFeRD schema and the actual ZUGFeRD properties.

Schema name: ZUGFeRD Schema
Preferred schema namespace prefix: zf
Schema namespace URI: urn:ferd:pdfa:CrossIndustryDocument:invoice:1p0#

Notes on the ZUGFeRD schema namespace URI:

- The use of mixed upper/lowercase in "CrossIndustryDocument" conforms to
  the ZUGFeRD 1.0 specification. The PDF samples distributed with the
  ZUGFeRD 1.0 info package use all-lowercase spelling "crossindustrydocument"
  which is not correct since it violates the ZUGFeRD specification.

- The required trailing "#" character is missing in the comment in the
  ZUGFeRD 1.0 extension schema description which is included in the ZUGFeRD
  specification, but it is correctly present in the actual XMP.


Based on the ZUGFeRD 1.0 package (published 2014-06 on www.ferd-net.de)
which is Copyright AWV e.V. 2014.


2014-07-01 (based on ZUGFeRD 1.0)
Adjustments for ZUGFeRD 1.0:
- updated header comments
- switched to new namespace URI
- adjusted property descriptions in the extension schema descriptions

2013-06-19 (based on ZUGFeRD RC)
Added a trailing hash character "#" to the "zf" namespace name as required
by the XMP 2005 specification which is referenced in PDF/A-2 and PDF/A-3.
Without this change Acrobat XI Preflight validation for PDF/A-3 complains
"Extension schema present but not valid"

2013-06-19
Singled out the zf properties into a separate rdf:Description node to work
around bug #4433 in PDFlib 9.0.0 which has been fixed in PDFlib 9.0.1.

-->
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#">
<!--  The actual ZUGFeRD properties; adjust if required  -->
<rdf:Description xmlns:zf="urn:ferd:pdfa:CrossIndustryDocument:invoice:1p0#" rdf:about="">
<zf:ConformanceLevel>BASIC</zf:ConformanceLevel>
<zf:DocumentFileName>ZUGFeRD-invoice.xml</zf:DocumentFileName>
<zf:DocumentType>INVOICE</zf:DocumentType>
<zf:Version>1.0</zf:Version>
</rdf:Description>
<!--
 PDF/A extension schema description for the ZUGFeRD schema.
     It is crucial for PDF/A-3 conformance. Don't touch! 
-->
<rdf:Description xmlns:pdfaExtension="http://www.aiim.org/pdfa/ns/extension/" xmlns:pdfaSchema="http://www.aiim.org/pdfa/ns/schema#" xmlns:pdfaProperty="http://www.aiim.org/pdfa/ns/property#" rdf:about="">
<pdfaExtension:schemas>
<rdf:Bag>
<rdf:li rdf:parseType="Resource">
<pdfaSchema:schema>ZUGFeRD PDFA Extension Schema</pdfaSchema:schema>
<pdfaSchema:namespaceURI>urn:ferd:pdfa:CrossIndustryDocument:invoice:1p0#</pdfaSchema:namespaceURI>
<pdfaSchema:prefix>zf</pdfaSchema:prefix>
<pdfaSchema:property>
<rdf:Seq>
<rdf:li rdf:parseType="Resource">
<pdfaProperty:name>DocumentFileName</pdfaProperty:name>
<pdfaProperty:valueType>Text</pdfaProperty:valueType>
<pdfaProperty:category>external</pdfaProperty:category>
<pdfaProperty:description>name of the embedded XML invoice file</pdfaProperty:description>
</rdf:li>
<rdf:li rdf:parseType="Resource">
<pdfaProperty:name>DocumentType</pdfaProperty:name>
<pdfaProperty:valueType>Text</pdfaProperty:valueType>
<pdfaProperty:category>external</pdfaProperty:category>
<pdfaProperty:description>INVOICE</pdfaProperty:description>
</rdf:li>
<rdf:li rdf:parseType="Resource">
<pdfaProperty:name>Version</pdfaProperty:name>
<pdfaProperty:valueType>Text</pdfaProperty:valueType>
<pdfaProperty:category>external</pdfaProperty:category>
<pdfaProperty:description>The actual version of the ZUGFeRD XML schema</pdfaProperty:description>
</rdf:li>
<rdf:li rdf:parseType="Resource">
<pdfaProperty:name>ConformanceLevel</pdfaProperty:name>
<pdfaProperty:valueType>Text</pdfaProperty:valueType>
<pdfaProperty:category>external</pdfaProperty:category>
<pdfaProperty:description>The conformance level of the embedded ZUGFeRD data</pdfaProperty:description>
</rdf:li>
</rdf:Seq>
</pdfaSchema:property>
</rdf:li>
</rdf:Bag>
</pdfaExtension:schemas>
</rdf:Description>
</rdf:RDF>

这是我创建的XML-String:                  

    Zweck des Forums für elektronische Rechnungen bei der AWV e.V („FeRD“) ist u.a. die Schaffung und Spezifizierung
    eines offenen Datenformats für strukturierten elektronischen Datenaustausch auf der Grundlage offener und nicht
    diskriminierender, standardisierter Technologien („ZUGFeRD Datenformat“)

    Das ZUGFeRD Datenformat wird nach Maßgabe des FeRD sowohl Unternehmen als auch der öffentlichen Verwaltung
    frei zugänglich gemacht. Hierfür bietet FeRD allen Unternehmen und Organisationen der öffentlichen Verwaltung eine
    Lizenz für die Nutzung des urheberrechtlich geschützten ZUGFeRD-Datenformats zu fairen, sachgerechten und nicht
    diskriminierenden Bedingungen an.

    Die Spezifikation des FeRD zur Implementierung des ZUGFeRD Datenformats ist in ihrer jeweils geltenden Fassung
    abrufbar unter www.ferd-net.de.

    Im Einzelnen schließt die Nutzungsgewährung ein:
    =====================================

    FeRD räumt eine Lizenz für die Nutzung des urheberrechtlich geschützten ZUGFeRD Datenformats in der jeweils
    geltenden und akzeptierten Fassung (www.ferd-net.de) ein.
    Die Lizenz beinhaltet ein unwiderrufliches Nutzungsrecht einschließlich des Rechts der Weiterentwicklung,
    Weiterbearbeitung und Verbindung mit anderen Produkten.
    Die Lizenz gilt insbesondere für die Entwicklung, die Gestaltung, die Herstellung, den Verkauf, die Nutzung oder
    anderweitige Verwendung des ZUGFeRD Datenformats für Hardware- und/oder Softwareprodukte sowie sonstige
    Anwendungen und Dienste.
    Diese Lizenz schließt nicht die wesentlichen Patente der Mitglieder von FeRD ein. Als wesentliche Patente sind Patente
    und Patentanmeldungen weltweit zu verstehen, die einen oder mehrere Patentansprüche beinhalten, bei denen es sich um
    notwendige Ansprüche handelt. Notwendige Ansprüche sind lediglich jene Ansprüche der Wesentlichen Patente, die durch
    die Implementierung des ZUGFeRD Datenformats notwendigerweise verletzt würden.
    Der Lizenznehmer ist berechtigt, seinen jeweiligen Konzerngesellschaften ein unbefristetes, weltweites, nicht übertragbares,
    unwiderrufliches Nutzungsrecht einschließlich des Rechts der Weiterentwicklung, Weiterbearbeitung und Verbindung mit
    anderen Produkten einzuräumen.

    Die Lizenz wird kostenfrei zur Verfügung gestellt.

    Außer im Falle vorsätzlichen Verschuldens oder grober Fahrlässigkeit haftet FeRD weder für Nutzungsausfall, entgangenen
    Gewinn, Datenverlust, Kommunikationsverlust, Einnahmeausfall, Vertragseinbußen, Geschäftsausfall oder für Kosten,
    Schäden, Verluste oder Haftpflichten im Zusammenhang mit einer Unterbrechung der Geschäftstätigkeit, noch für konkrete,
    beiläufig entstandene, mittelbare Schäden, Straf- oder Folgeschäden und zwar auch dann nicht, wenn die Möglichkeit der
    Kosten, Verluste bzw. Schäden hätte normalerweise vorhergesehen werden können.-->
    <rsm:CrossIndustryDocument xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
      <rsm:SpecifiedExchangedDocumentContext>
        <ram:GuidelineSpecifiedDocumentContextParameter>
          <ram:ID>urn:ferd:pdfa:CrossIndustryDocument:invoice:1p0#</ram:ID>
        </ram:GuidelineSpecifiedDocumentContextParameter>
      </rsm:SpecifiedExchangedDocumentContext>
      <rsm:HeaderExchangedDocument>
        <ram:TypeCode>380</ram:TypeCode>
        <ram:ID>2012-12345</ram:ID>
        <ram:Name>INVOICE</ram:Name>
        <ram:IssueDateTime>
          <udt:DateTimeString format="102">20160503</udt:DateTimeString>
        </ram:IssueDateTime>
      </rsm:HeaderExchangedDocument>
      <rsm:SpecifiedSupplyChainTradeTransaction>
        <ram:ApplicableSupplyChainTradeAgreement>
          <ram:SellerTradeParty>
            <ram:Name>Verkäufer AG</ram:Name>
          </ram:SellerTradeParty>
          <ram:BuyerTradeParty>
            <ram:Name>Käufer GmbH</ram:Name>
          </ram:BuyerTradeParty>
        </ram:ApplicableSupplyChainTradeAgreement>
        <ram:ApplicableSupplyChainTradeDelivery>
          <ram:ActualDeliverySupplyChainEvent>
            <ram:OccurrenceDateTime>
              <udt:DateTimeString format="102">20161103</udt:DateTimeString>
            </ram:OccurrenceDateTime>
          </ram:ActualDeliverySupplyChainEvent>
        </ram:ApplicableSupplyChainTradeDelivery>
      </rsm:SpecifiedSupplyChainTradeTransaction>
      <ram:ApplicableSupplyChainTradeSettlement>
        <ram:SpecifiedTradeSettlementPaymentMeans>
          <ram:ID schemeAgencyID="123456">ABCD</ram:ID>
          <ram:PayeePartyCreditorFinancialAccount>
            <ram:IBANID>DE123 12312 12312 1231231</ram:IBANID>
            <ram:AccountName>BigBoss</ram:AccountName>
          </ram:PayeePartyCreditorFinancialAccount>
          <ram:PayeeSpecifiedCreditorFinancialInstitution>
            <ram:BICID>WELADE9999999</ram:BICID>
          </ram:PayeeSpecifiedCreditorFinancialInstitution>
        </ram:SpecifiedTradeSettlementPaymentMeans>
        <ram:AcclicableTradeTax>
          <ram:CalculatedAmount currencyID="EUR">123.22</ram:CalculatedAmount>
          <ram:TypeCode>VAT</ram:TypeCode>
          <ram:ApplicablePercent>0.19</ram:ApplicablePercent>
        </ram:AcclicableTradeTax>
        <ram:AcclicableTradeTax>
          <ram:TaxBasisTotalAmount currencyID="EUR">120</ram:TaxBasisTotalAmount>
          <ram:LineTotalAmount currencyID="EUR">111</ram:LineTotalAmount>
          <ram:ChargeTotalAmount currencyID="EUR">20</ram:ChargeTotalAmount>
          <ram:AllowanceTotalAmount currencyID="EUR">15</ram:AllowanceTotalAmount>
          <ram:TaxBasisTotalAmount currencyID="EUR">11</ram:TaxBasisTotalAmount>
          <ram:TaxTotalAmount currencyID="EUR">111</ram:TaxTotalAmount>
          <ram:GrandTotalAmount currencyID="EUR">1234.11</ram:GrandTotalAmount>
        </ram:AcclicableTradeTax>
        <ram:InvoiceCurrencyCode>EUR</ram:InvoiceCurrencyCode>
      </ram:ApplicableSupplyChainTradeSettlement>
      <ram:IncludedSupplyChainTradeLineItem>
        <ram:SpecifiedSupplyChainTradeDelivery>
          <ram:BilledQuantity unitCode="KG">5</ram:BilledQuantity>
        </ram:SpecifiedSupplyChainTradeDelivery>
        <ram:SpecifiedTradeProduct>
          <ram:Name>Foo</ram:Name>
        </ram:SpecifiedTradeProduct>
      </ram:IncludedSupplyChainTradeLineItem>
      <ram:IncludedSupplyChainTradeLineItem>
        <ram:SpecifiedSupplyChainTradeDelivery>
          <ram:BilledQuantity unitCode="Liter">3</ram:BilledQuantity>
        </ram:SpecifiedSupplyChainTradeDelivery>
        <ram:SpecifiedTradeProduct>
          <ram:Name>Bar</ram:Name>
        </ram:SpecifiedTradeProduct>
      </ram:IncludedSupplyChainTradeLineItem>
      <ram:IncludedSupplyChainTradeLineItem>
        <ram:SpecifiedSupplyChainTradeDelivery>
          <ram:BilledQuantity unitCode="Stück">15</ram:BilledQuantity>
        </ram:SpecifiedSupplyChainTradeDelivery>
        <ram:SpecifiedTradeProduct>
          <ram:Name>FooBar</ram:Name>
        </ram:SpecifiedTradeProduct>
      </ram:IncludedSupplyChainTradeLineItem>
    </rsm:CrossIndustryDocument>

这是我将XMP和XML附加到文件的perl代码:         使用pdflib_pl;

    my $pdf = PDF_new();

    PDF_set_parameter($pdf, "textformat", "utf8");
    PDF_set_parameter($pdf, "SearchPath", "/usr/share/htmldoc/fonts");
    PDF_set_parameter($pdf, "FontAFM", "Helvetica=Helvetica.afm");
    PDF_set_parameter($pdf, "FontOutline", "Helvetica=Helvetica.pfa");

    my $font = PDF_load_font($pdf, "Helvetica", "unicode", "embedding=true");

    PDF_begin_document($pdf,'test.pdf', "pdfa=PDF/A-3b metadata={filename=zugferd/ZUGFeRD-invoice.xmp}");
    PDF_load_iccprofile($pdf, "sRGB", "usage=outputintent");

    # At this point I create the XML-File I attached to this question
    my $xmlData = CreateXmlData();

    PDF_create_pvf($pdf, '/pvf/ZUGFeRD-invoice.xml', $xmlData, "");

    my $xml_asset = PDF_load_asset($pdf,
                                   "Attachment",
                                   '/pvf/ZUGFeRD-invoice.xml',
                                   "mimetype=text/xml description={Rechnungsdaten im Zugferd-Xml-Format} relationship=Alternative documentattachment=true");

    PDF_begin_page($pdf, 595, 842);
    PDF_setfont($pdf, $font, 12);
    PDF_fit_textline($pdf, 'test', 400, 600, "boxsize={50 20}");
    PDF_end_page($pdf);

    PDF_end_document($pdf, "associatedfiles={" . $xml_asset . "} metadata={filename=zugferd/ZUGFeRD-invoice.xmp}");
    PDF_delete_pvf($pdf, '/pvf/ZUGFeRD-invoice.xml');

    PDF_end_document($pdf, "associatedfiles={" . $xml_asset . "} metadata={filename=zugferd/ZUGFeRD-invoice.xmp}");
    PDF_delete_pvf($pdf, $virtualXml);

1 个答案:

答案 0 :(得分:3)

您的代码不完整。在加载资源并关闭文档之前,您应该至少创建一个空页面(PDF_begin_page_ext()/ PDF_end_page_ext()。但更好的是,您应该添加发票的可视内容或从PDF / A文档导入PDF页面(如链接的食谱样本那样)

出于调试目的,我建议在脚本开头将errorpolicy设置为exception。

 PDF_set_parameter($pdf, "errorpolicy", "exception");

在这种情况下,一旦发生错误,您将获得异常。

希望这有帮助。