我们有一些生成PDF的工具。我们希望自动化一些测试,以确保生成的PDF被标记(PDF / UA)并且标记有效。
有很多交互式检查器(acrobat,PDF Accessibility Checker(PAC)等)。它们基于matterhorn protocol生成PDF中通过/失败的事物的报告。我想生成这些类似的报告,但是自动生成。
我最近发现了一个perl模块PDF::API2,这可能很有希望,但我在15年前只用perl编写了一些简单的测试。有没有人使用该模块进行标记的pdf检查,或者您是否使用不同的脚本语言?
答案 0 :(得分:0)
Adobe Acrobat中使用的技术(在其预检组件中)是由卡拉斯软件开发的(警告:我与该公司有很大关系)。 callas还开发了名为pdfaPilot的相同技术,该技术以手动版本存在,但也在命令行和SDK版本中完全自动化。
但是!
正如Max Wyss在对您的问题的评论中所述,PDF / UA检查分为两部分。某些规范的规则可以由软件自动测试,但很多规则不能。
举一个例子,可以通过编程方式验证PDF文档中的所有文本都是用语言标记的。这是一个完整的其他球赛,以检查这些语言标签是否真的是正确的。
pdfaPilot Desktop实际上允许您自动检查可能的内容,然后允许您将PDF / UA文件转换为可视标记的HTML,这样可以更容易地验证文本的含义和结构是否正确。
换句话说,是的,这种技术存在,但永远不会100%完成。