如何将目录/文件夹中的所有pdf文件转换为图像python 3?还有其他选择吗?
运行此代码时出现类似错误
pdf2image.exceptions.PDFPageCountError:无法获取页数。 语法警告:可能不是PDF文件(无论如何仍在继续)语法 错误:找不到预告字典语法错误:找不到 尾部字典语法错误:无法读取外部参照表
我不知道为什么请有人帮助我
from pdf2image import convert_from_path
import glob,os
import os, subprocess
pdf_dir = r"C:\\Users\\xxx\\Desktop\\folder1\\folder2\\"
os.chdir(pdf_dir)
for pdf_file in os.listdir(pdf_dir):
pages = convert_from_path(pdf_file, 500)
for page in pages:
page.save(pdf_file[:-4] +".jpg", 'JPEG')
答案 0 :(得分:1)
我认为JPG和PDF都位于同一目录中。要仅遍历PDF文件:
from pdf2image import convert_from_path
import glob,os
import os, subprocess
pdf_dir = r"C:\\Users\\xxx\\Desktop\\folder1\\folder2\\"
os.chdir(pdf_dir)
for pdf_file in glob.glob(os.path.join(path.dir, "*.pdf")):
pages = convert_from_path(pdf_file, 500)
for page in pages:
page.save(pdf_file[:-4] +".jpg", 'JPEG')