如何判断PDF是否已标记

时间:2012-05-27 15:29:20

标签: php pdf accessibility tcpdf fpdf

是否可以以编程方式确定PDF是否已“标记”(用于辅助功能)?我正在使用PHP,并且希望(如果可能的话)只读取PDF文件并在标记时返回true,否则返回false。

我查看了FPDFTCPDF,但我不清楚是否可以提取此信息。

2 个答案:

答案 0 :(得分:5)

在ISO PDF-1.7官方规范中(可从Adobe网站免费下载),我在第574页阅读:

  

“标记的PDF文档还应包含标记条目的值 true 的标记信息字典(参见表321)。” EM>

对我来说意味着......

  1. ...您必须解析PDF结构和
  2. ...查找文档目录
  3. ...应该有 MarkInfo 条目
  4. ...指定标记信息词典
  5. ...其中应包含名为标记的键,其标记PDF的布尔值为 true

答案 1 :(得分:3)

也许您可以进一步使用this(检查所有 PDF_get_xx 功能)。 您还需要this作为参考。

基于此:

Characteristics of a properly tagged PDF:

    - The PDF file includes a logical reading order for its content
    - Images are given correct alternate descriptions
    - Tables are correctly tagged to represent the table structure
    - Form-fields are authored to promote their utility to screen-readers
    - Represents text as Unicode to clear up composition irregularities such as soft
      and hard hyphens

你可能会更进一步。