我正在尝试重新排序我拥有的pdf页面。共有716页,每页都有编号。并非所有页面都在同一位置编号,但它们以“样式”编号。我想知道如何根据文档页面上的页码重新排序页面? pdf页码是可编辑的文本。
以下是三种风格的示例:
我看过一些关于创建书签的帖子。我发现了一个可以根据一些名为autobookmark插件的文本样式创建书签的插件。我只是不确定这方面的方向。有太多页面可以手动完成。
正在修改的网页编号:
答案 0 :(得分:2)
我在这里提出的建议是PDFSharp。该库允许您打开pdf文件,按页面拆分然后排序。
如果我认真对待,输入文档中的页面没有排序 - 所以首先将pdf页面转储到文本文件(对于所有三种情况)都是很好的任务,看看它有多难提取页码块(正则表达式或pdf语言标记)。
最后一步 - 创建包含按新号码排序的页面的新文档
从上面引用的sourceforge存储库:
描述
PDFsharp是一个.NET库,用于以编程方式从任何.NET语言(如C#或VB.NET)创建和修改Adobe PDF文档。 PDFsharp定义了PDF文件中找到的对象的类,所以你 永远不必直接处理ID或引用。
最后更新于2015年12月