从pdf中删除一些图像和文本对象

时间:2013-09-20 09:17:04

标签: python pdf pypdf

我有一个带有图像和大量文本的pdf页面对象。

我想删除该图片并根据其内容删除一些文本对象。那就是我想获取所有文本对象的内容,如果满足条件,则删除其中的一些内容。

我如何使用PyPDF2(文档真的很差)?或者是否有另一个允许这样做的图书馆?

由于

1 个答案:

答案 0 :(得分:1)

要使用PyPDF2从PDF文件中删除所有图像,您可以执行以下操作:

Derived