我正在尝试进行一些OCR工作。 pytesseract
在Wand图像上不能很好地播放,但是Python图像库无法完成我想做的一些图像转换,从而使OCR的性能更好。
此刻,我正在使用Wand打开图像,进行ImageMagick转换,然后将其保存到一个临时文件中,然后使用Pillow打开并传递给pytesseract。有没有一种方法可以在不使用临时文件的情况下做到这一点?我希望能够使用在并行运行时不会相互冲突的功能来处理所有这些问题。
答案 0 :(得分:0)
要从魔杖转到PIL,可以使用io.BytesIO
:
with io.BytesIO() as transfer:
with WandImage(filename=fpath) as img:
img.unsharp_mask(radius=2, sigma=0, amount=75, threshold=2)
img.level(black=150/255, white=202/255, gamma=2.1)
img.save(transfer)
with Image.open(transfer) as img:
text = pytesseract.image_to_string(img)
with open('./%s/%s-tess4.txt' % (outputdir, fname), 'w+') as f:
f.write(text)
但这似乎无法将PIL图像移到Wand中。