itext 7-无法获取字段的制表符顺序

时间:2019-07-02 06:50:28

标签: itext itext7

是否可以使用iText7获取PDF字段的制表符顺序?

您可以在Acrobat中定义制表符顺序,但是在iText7库中似乎无法获得该制表符顺序。

我正在编写一个应用程序,该应用程序从PDF文件中提取字段,并希望根据PDF中定义的选项卡顺序对这些字段进行排序。

1 个答案:

答案 0 :(得分:1)

页面上字段的顺序(或更重要的是:批注)由页面字典中的 Tabs 条目确定。其值指定为:

  

(可选; PDF 1.5)一个名称,用于指定在页面上用于注释的制表符顺序(请参见12.5“注释”)。可能的值应为 R (行顺序), C (列顺序)和 S (结构顺序)。从PDF 2.0开始,可能的值还包括 A (注释数组顺序)和 W (小部件顺序)。注释数组顺序是指Page字典的 Annots 条目中枚举的注释的顺序(请参阅“表31-页面对象中的条目”)。窗口小部件顺序是指使用相同的数组顺序,但要经过两次,第一次仅选择窗口小部件注释,第二次选择所有其他注释。

(ISO 32000-2,表31-页面对象中的条目)

要实现根据PDF中定义的制表符顺序提取要排序的字段的任务,因此,您必须读取有问题的页面的此值,并根据该值分析注释坐标,结构树或注释数组。

顺便说一句,对于具有多个小部件的字段,这意味着它们也具有多个标签位置;因此,对于某些文档,可能无法导出要根据PDF中定义的制表符顺序进行排序的字段。