我正在尝试使用非常棒的PDFTron库来删除一系列PDF文档中的大量非常小的图像。基本上我想通过遍历现有PDF文件中的每个元素并将符合特定大小标准的元素复制到同一位置的新PDF来创建新的PDF。
有人可以指导我专门针对Python的PDFTron文档来帮助我实现这一目标吗?或者提供检查图像大小的示例脚本?我想我可以做其余的事情(强调思考)。 PDFTron网站上提供的文档不是专门针对Python的,很难查找我需要的内容......
答案 0 :(得分:0)
您可以从ElementEdit示例中看到如何从文档中删除所有图像:
http://www.pdftron.com/pdfnet/samplecode.html#ElementEdit
或提供检查图像大小的示例脚本?
你能澄清你的意思"图像大小"?如果您的意思是PDF页面中显示的图像尺寸,您可以使用Element.GetBBox进行检查。如果您的意思是原始图像的尺寸,您可以使用Element.GetImageWidth和Element.GetImageHeight检查它(请参阅http://www.pdftron.com/pdfnet/samplecode.html#ImageExtract)。此外,Image.GetImageDataSize为您提供图像数据的大小(以字节为单位)。