如何使用python和OCR引擎识别图片中的数字?

时间:2016-11-30 02:02:32

标签: python opencv

大家好,我尝试做的就是让python识别出这张照片just the number 96 in a white background。并告诉我一个" 96"在字符串中,这就是全部。

Image of the number 96

为此我已经使用命令提示符(pip install pytesseract)将pytesseract安装到python中,我也安装了Pil(现在是枕头,并且还使用命令提示符安装它),Tesseract OCR引擎也安装在我的计算机,我下载并安装它,在我的环境变量中(在命令提示符下键入path命令,它显示我的Tesseract-OCR),最后我还下载了pytesser,将文件解压缩到目录:C:\ Python27 \ LIB。几乎忘了提一下,我的python版本是2.7.12,安装的OpenCV版本是3.1.0。 我做的是运行以下脚本:

from PIL import Image
import pytesseract
img=Image.open('E:\Alex2016\Python OpenCV\Scripts\imagenFinal.jpg')
a=pytesseract.image_to_string(img)
print(a)
img.show()

它只显示我的图像,但没有" 96"串。我是这个家伙的新手,我甚至不知道我是否真的使用Tesseract-OCR,我知道这是一个超级强大的引擎。我在python shell中运行我的脚本。我还要提到,我无法使pytesser工作,因为在尝试"导入pytesser"或者从pytesser import *"做#34;就像我在其他网站上看到的一样,我收到了这个错误

import pytesser ImportError: No module named pytesser

我认为这张图片非常容易理解并且免费嘈杂,所以如果你能告诉我如何使用这些工具检测数字,或者是否还有其他任何可以做到这一点的人,非常感谢你们这些时间,我感谢你们。我对这个东西很陌生,但我对这个科学领域,计算机视觉技术非常感兴趣。

1 个答案:

答案 0 :(得分:-1)

我认为错误发生在print(a),因为你使用的是Python 2.7,在这种情况下,打印函数的正确语法是print a