如何在将pdf转换为图像时解决pdf2image生成的盒子的问题?

时间:2020-01-17 06:27:43

标签: python

我正在尝试使用pdf2image将pdf转换为图像,但是出现了额外生成的框的问题。 这是我输入的pdf文件的屏幕截图

this in input file

from pdf2image import convert_from_path

images = convert_from_path('input_pdf.pdf',output_folder=r'C:\Users\Baith')

images[0].save('output.jpg')

执行上述代码后得到此输出 output_file

1 个答案:

答案 0 :(得分:0)

由于pdf2image只是pdftoppm(它本身是poppler的一部分)周围的薄包装,我建议使用CLI工具尝试不同的参数,以查看特定组合是否有效。

对于pdf2image本身,您可能想尝试use_cropbox=True并查看它是否仍添加行。

随时可以直接从存储库中打开问题,如果您可以提供样本PDF,我们将很乐意为您提供帮助。