我正在尝试使用pdf2image将pdf转换为图像,但是出现了额外生成的框的问题。 这是我输入的pdf文件的屏幕截图
from pdf2image import convert_from_path
images = convert_from_path('input_pdf.pdf',output_folder=r'C:\Users\Baith')
images[0].save('output.jpg')
执行上述代码后得到此输出 output_file
答案 0 :(得分:0)
由于pdf2image
只是pdftoppm
(它本身是poppler的一部分)周围的薄包装,我建议使用CLI工具尝试不同的参数,以查看特定组合是否有效。
对于pdf2image
本身,您可能想尝试use_cropbox=True
并查看它是否仍添加行。
随时可以直接从存储库中打开问题,如果您可以提供样本PDF,我们将很乐意为您提供帮助。