使用PDFMiner编辑pdf文件

时间:2011-11-23 20:28:36

标签: python pdf

我想知道是否可以使用Pdfminerédit现有的pdf文件。它看起来是一个强大的工具,但文档很差/不存在。 我找到了一些例子,但它们与我的目标不符。我想创建一个搜索引擎,用于更改pdf文件中关键字的颜色。

2 个答案:

答案 0 :(得分:0)

PDFMiner不是用于更改现有PDF文件,而是用于从中提取文本和元数据。使用PDFMiner的最接近的解决方案可能是使用附带的pdf2txt.py工具提取文本,然后将其标记以突出显示您的关键字。

还有一个简单的选项,即只使用具有内置功能的PDF查看器来查找和突出显示多个搜索词。我认为Adobe Acrobat可以做到,但我不确定其他人。

答案 1 :(得分:0)

不,pdfminer不支持编辑。

但是,如果您不尝试修改pdf,可能要容易得多,但请改用PDFOpenParameters:http://partners.adobe.com/public/developer/en/acrobat/PDFOpenParameters.pdf

您可以使用以下网址片段标识符:

http://www.example.com/test.pdf#search=foo

甚至在命令行上打开Acrobat时(Windows示例)

AcroRd32.exe /A "search=foo" test.pdf

您还可以打开特定页面的pdf,并突出显示该页面的某个区域(但不能同时突出显示不同页面上的不同区域)。

(好吧,我知道这不是你提出的问题的真正解决方案,但如果这足以满足你的需求,那么很多更简单)