Tesseract OCR,Python和Windows XP

时间:2013-11-11 09:05:31

标签: python windows ocr tesseract

大家晚上,

我试图使用这里找到的tesseract(OCR)python包装器,第一个例子: https://code.google.com/p/python-tesseract/wiki/CodeSnippets

我在Windows XP机器上使用Python27。一切都是32位。

我已经安装了本指南中的所有依赖项: http://opencvpython.blogspot.com/2012/05/install-opencv-in-windows-for-python.html

我检查了环境变量: TESSDATA_PREFIX = C:\ Program Files \ Tesseract-OCR \ tessdata \

最后,我尝试在cmd.exe中执行脚本: “python.exe 119.py”(119.py是CodeSnippets中的第一个示例,具有不同的c图像),我收到以下错误:

C:\ Python27> python.exe 119.py 打开数据文件C时出错:\ Program Files \ Tesseract-OCR \ tessdatatessdata / eng.trai neddata 请确保将TESSDATA_PREFIX环境变量设置为父d 你的“tessdata”目录的序列。 加载语言'eng'失败 Tesseract无法加载任何语言!

现在,我唯一注意到的是在eng.traineddata之前的斜杠(/)而不是反斜杠(\),这是在环境变量之后自动添加的位。 我希望这是唯一需要修复的东西,但我不知道怎么做,这就是我在这里的原因...... :)

所以,经验丰富的程序员,二元神,请帮助我。 提前致谢。 :)

P.S。

我需要在这个项目中使用Windows机器,所以在这里开启Linux作为一种简单的方法并不是一个选择。 :(

1 个答案:

答案 0 :(得分:0)

我遇到了同样的错误,并且在cmd中通过此命令设置了错误之后,它接受了。

set TESSDATA_PREFIX=C:/Program Files (x86)/Tesseract-OCR/tessdata

即使Windows接受反斜杠,也需要使用正斜杠。