我正在尝试将文本图像转换为文本。我在python中使用pytesser
,因为我已经安装了tesseract但是运行了甚至以下代码:
from pytesser import *
im = Image.open('phototest.tif')
text = image_to_string(im)
print text
我收到以下错误:
Tesseract Open Source OCR Engine with Leptonica
Please call SetImage before attempting recognition.
没有任何东西得到打印(没有结果)。 有关上述问题的任何帮助?
答案 0 :(得分:3)
尝试将图片转换为其他格式,看看是否有同样的问题。从命令行使用Tesseract我遇到了同样的问题。我有一个bmp
文件,我将预处理中的文件保存到png
,并且tesseract工作正常。
答案 1 :(得分:0)
作为替代方案,您可以使用pytesseract,它会自动转换您的图片并正确处理。