在Java中,我希望能够读取PDF文件,测试它是否符合PDF / A(PDF for Archiving),如果没有,则将文件转换为PDF / A.
我可能更喜欢Apache PDFBox中的这个,因为我已经在该API中做了一些事情,但我也会对其他API开放。
答案 0 :(得分:4)
测试PDF文件是否为PDF / A-1b可以使用PDFBox预检,请参阅示例here或使用预检应用程序。
创建将文件从PDF转换为PDF / A的工具是一项艰巨的任务,需要数月甚至数年。如果查看PDFBox预检的源代码,您将发现数百条错误消息。因此,您的工具必须能够修复每个错误。有些是:
只需使用PDFBox预检检查一些您自己的文件,您就会发现各种各样的问题......
如果您没有数月或数年,请访问Callas Software GmbH
或PDF Tools AG
的主页以购买此类转换器。