有谁知道acrobat reader如何知道我正在查看的页面? 例如 - 我有一个PDF文件,其中包含页脚的页码格式 - 1 / A或1/1 - 分为章节,而acrobat知道这是页面的数量 - 它不会只写入从开始到页面的总页数这个当前页面。
我正在编写C#apps,WinForms,我需要获取页面数量 - 与acrobat一样。 我正在使用pdfLibView lib将每个页面转换为文本,但是,我需要查看最后一页并使用复杂的算法来找出页脚中的哪个字符串是页码 - 它可以包含任何其他信息。
所以任何想法,如何获得页面上写的页码?
答案 0 :(得分:1)
您的文档似乎使用PDF规范中定义的页面标签功能。
8.3.1 Page Labels说:
此外,文档可以选择定义页面标签(PDF 1.3) 在屏幕上或在打印中直观地识别每个页面。页面标签和 页面索引不需要重合:索引是固定的,正在运行 连续通过文件从0开始为第一页, 但标签可以任何适合的方式指定 特别文件。例如,如果文档以12页开头 用罗马数字编号的前面的物质和其余的 文档以阿拉伯语编号,第一页将有页面索引 为0和页面标签为i,第12页将具有索引11和 标签xii,第十三页的索引为12,标签为1。
如果您想访问现有文档中的页面标签信息,可以尝试Docotic.Pdf library(免责声明:我为图书馆的供应商工作)。
以下是add Page Labels to PDF document的示例。此示例未显示如何访问现有标签,但可能会为开始提供一些线索。