您好我试图使用以下代码将不可读的pdf转换为jpegs:
import cv2
import pytesseract
import re
import os
from wand.image import Image
from PIL import Image as PI
from pyocr import pyocr
from pyocr import builders
import io
from pyocr import tesseract as tool
req_image = []
final_text = []
os.chdir("E:\\NonReadablePath")
os.getcwd()
with Image(filename='E:\\NonReadablePath\\2563989.pdf') as img:
print('pages = ', len(img.sequence))
with img.convert('png') as converted:
converted.save(filename='pyout/page.png')
我遇到这个错误: DelegateError:PDFDelegateFailed`系统找不到指定的文件。 '@ error / pdf.c / ReadPDFImage / 800 触发“with Image(filename ='E:\ NonReadablePath \ 2563989.pdf')”img:“
我在使用anaconda 4.4.1的Windows 10上使用了python 3.6 我还安装了ImageMagick和Ghostscript,并为上述两个工具设置了envirnoment变量MAGICK_HOME。
任何帮助都将不胜感激。
答案 0 :(得分:0)
我是新来的,请原谅我的格式。我遇到了同样的问题,网上似乎没有一个好的解决方案,如果您想将pdf转换为jpg,我发现这个名为convertapi的免费api非常易于使用,唯一的缺点是您的免费转换时间有限。
这是convertapi的代码
> Property.where('property_type.name = "Residential"').count
(5.4ms) SELECT COUNT(*) FROM "properties" WHERE (property_type.name = "Residential")
ActiveRecord::StatementInvalid: PG::UndefinedTable: ERROR: missing FROM-clause entry for table "property_type"
LINE 1: SELECT COUNT(*) FROM "properties" WHERE (property_type.name...
可以使用pip命令安装convertapi,并在使用convertapi创建帐户后立即提供密钥。我希望这对某人有帮助,并节省了花费数小时进行调试的麻烦。干杯