大家晚上,
我试图使用这里找到的tesseract(OCR)python包装器,第一个例子: https://code.google.com/p/python-tesseract/wiki/CodeSnippets
我在Windows XP机器上使用Python27。一切都是32位。
我已经安装了本指南中的所有依赖项: http://opencvpython.blogspot.com/2012/05/install-opencv-in-windows-for-python.html
我检查了环境变量: TESSDATA_PREFIX = C:\ Program Files \ Tesseract-OCR \ tessdata \
最后,我尝试在cmd.exe中执行脚本: “python.exe 119.py”(119.py是CodeSnippets中的第一个示例,具有不同的c图像),我收到以下错误:
C:\ Python27> python.exe 119.py 打开数据文件C时出错:\ Program Files \ Tesseract-OCR \ tessdatatessdata / eng.trai neddata 请确保将TESSDATA_PREFIX环境变量设置为父d 你的“tessdata”目录的序列。 加载语言'eng'失败 Tesseract无法加载任何语言!
现在,我唯一注意到的是在eng.traineddata之前的斜杠(/)而不是反斜杠(\),这是在环境变量之后自动添加的位。 我希望这是唯一需要修复的东西,但我不知道怎么做,这就是我在这里的原因...... :)
所以,经验丰富的程序员,二元神,请帮助我。 提前致谢。 :)
P.S。
我需要在这个项目中使用Windows机器,所以在这里开启Linux作为一种简单的方法并不是一个选择。 :(
答案 0 :(得分:0)
我遇到了同样的错误,并且在cmd中通过此命令设置了错误之后,它接受了。
set TESSDATA_PREFIX=C:/Program Files (x86)/Tesseract-OCR/tessdata
即使Windows接受反斜杠,也需要使用正斜杠。