如何在Java中将PDF转换为PDF / A

时间:2016-08-03 07:34:22

标签: parsing pdf document pdfbox pdfa

在Java中,我希望能够读取PDF文件,测试它是否符合PDF / A(PDF for Archiving),如果没有,则将文件转换为PDF / A.

我可能更喜欢Apache PDFBox中的这个,因为我已经在该API中做了一些事情,但我也会对其他API开放。

1 个答案:

答案 0 :(得分:4)

测试PDF文件是否为PDF / A-1b可以使用PDFBox预检,请参阅示例here或使用预检应用程序。

创建将文件从PDF转换为PDF / A的工具是一项艰巨的任务,需要数月甚至数年。如果查看PDFBox预检的源代码,您将发现数百条错误消息。因此,您的工具必​​须能够修复每个错误。有些是:

  • 非嵌入字体
  • 使用没有输出意图的颜色
  • 不正确的元数据
  • JBIG2编码图像
  • LZW编码数据

只需使用PDFBox预检检查一些您自己的文件,您就会发现各种各样的问题......

如果您没有数月或数年,请访问Callas Software GmbHPDF Tools AG的主页以购买此类转换器。