PDF创建,可以在不同的PDF文件上使用过滤器

时间:2013-07-12 07:38:27

标签: xml database pdf pdf-generation

我需要你的帮助,我想到了一个想法。

我有大量的PDF文件,这是我的同事们的测试。我想创建一个新的PDF文件,其中包含每个PDF的一个练习(如果可能的话,使用过滤词来确定选择哪个练习)。

问题是我希望这个过程自动化。也就是说,只需点击一下按钮,就可以将来自不同PDF文件的大量练习过滤成新的PDF文件,并将其保存在磁盘的某个位置。

以下是关于这个想法的问题:

  1. 有没有可用的免费软件?

  2. 如果我想自己实现它,我该如何创建一个数据库,允许我以原始外观(边距等)保存和提取PDF内容。

  3. 非常感谢!

1 个答案:

答案 0 :(得分:0)

您可以使用iTextSharp或PdfSharp来实现解决方案,假设每个练习都是在新页面上开始的。
循环浏览文档的页面并在当前页面中搜索“练习”一词。如果找到该单词,则创建一个新的空文档,从源文件中提取该页面并将其插入新文档中。搜索下一页,如果找到“练习”字样,请保存上一个文档并创建一个新文档。如果找不到该单词,请提取页面并插入您已创建的文档中。
通过这种方式,您可以实现任何所需的过滤。