有没有办法自动化/脚本(例如perl)标记的pdf文件,看看它是否符合pdf / ua?

时间:2015-10-30 18:52:19

标签: pdf accessibility

我们有一些生成PDF的工具。我们希望自动化一些测试,以确保生成的PDF被标记(PDF / UA)并且标记有效。

有很多交互式检查器(acrobat,PDF Accessibility Checker(PAC)等)。它们基于matterhorn protocol生成PDF中通过/失败的事物的报告。我想生成这些类似的报告,但是自动生成。

我最近发现了一个perl模块PDF::API2,这可能很有希望,但我在15年前只用perl编写了一些简单的测试。有没有人使用该模块进行标记的pdf检查,或者您是否使用不同的脚本语言?

1 个答案:

答案 0 :(得分:0)

Adob​​e Acrobat中使用的技术(在其预检组件中)是由卡拉斯软件开发的(警告:我与该公司有很大关系)。 callas还开发了名为pdfaPilot的相同技术,该技术以手动版本存在,但也在命令行和SDK版本中完全自动化。

但是!

正如Max Wyss在对您的问题的评论中所述,PDF / UA检查分为两部分。某些规范的规则可以由软件自动测试,但很多规则不能。

举一个例子,可以通过编程方式验证PDF文档中的所有文本都是用语言标记的。这是一个完整的其他球赛,以检查这些语言标签是否真的是正确的。

pdfaPilot Desktop实际上允许您自动检查可能的内容,然后允许您将PDF / UA文件转换为可视标记的HTML,这样可以更容易地验证文本的含义和结构是否正确。

换句话说,是的,这种技术存在,但永远不会100%完成。