如何将目录/文件夹中的所有pdf文件转换为图像python 3?

时间:2019-06-18 09:02:32

标签: python image pdf

如何将目录/文件夹中的所有pdf文件转换为图像python 3?还有其他选择吗?

运行此代码时出现类似错误

  

pdf2image.exceptions.PDFPageCountError:无法获取页数。   语法警告:可能不是PDF文件(无论如何仍在继续)语法   错误:找不到预告字典语法错误:找不到   尾部字典语法错误:无法读取外部参照表

我不知道为什么请有人帮助我

from pdf2image import convert_from_path
import glob,os
import os, subprocess

pdf_dir = r"C:\\Users\\xxx\\Desktop\\folder1\\folder2\\"
os.chdir(pdf_dir)

for pdf_file in os.listdir(pdf_dir):
    pages = convert_from_path(pdf_file, 500)
    for page in pages:
        page.save(pdf_file[:-4] +".jpg", 'JPEG')

1 个答案:

答案 0 :(得分:1)

我认为JPG和PDF都位于同一目录中。要仅遍历PDF文件:

from pdf2image import convert_from_path
import glob,os
import os, subprocess

pdf_dir = r"C:\\Users\\xxx\\Desktop\\folder1\\folder2\\"
os.chdir(pdf_dir)

for pdf_file in glob.glob(os.path.join(path.dir, "*.pdf")):
    pages = convert_from_path(pdf_file, 500)
    for page in pages:
        page.save(pdf_file[:-4] +".jpg", 'JPEG')