我想在Mac OS X上使用python中的pdf2image将pdf转换为图像。
from pdf2image import convert_from_path, convert_from_bytes
from pdf2image.exceptions import (
PDFInfoNotInstalledError,
PDFPageCountError,
PDFSyntaxError
)
# define pdf path
# convert pdf to image(1200dpi)
pdf_path = Path(".")
images = convert_from_path(str(pdf_path), 1200)
# save image files one by one
image_dir = Path(".")
for i, page in enumerate(pages):
file_name = pdf_path.stem + "_{:02d}".format(i + 1) + ".jpeg"
image_path = image_dir / file_name
# save JPEG
page.save(str(image_path), "JPEG")
然后我得到了空文件... 我不明白发生了什么。 任何人的想法吗?
答案 0 :(得分:0)
Hiro
通过使用pdf2image
库,可以像这样将pdf
转换为image
,
from pdf2image import convert_from_path
pages = convert_from_path('pdf_file', 500) // where 500 is dpi
以jpeg格式保存页面
for page in pages:
page.save('out.jpg', 'JPEG')
要转换PDF的第一页,请检查此示例,
from pdf2image import convert_from_path
pages = convert_from_path('file.pdf', 500)
pages = convert_from_path('file.pdf', 500, single_file=True)
pages[0].save('file.jpg', 'JPEG')