在大学工作时,我遇到的问题是无法更改tessdata中的“数字”等配置文件,因为我没有管理员权限。所以我想从家里运行所有东西,在那里创建模式,配置和训练数据文件。像我这样开始检测可以正常工作:
tesseract ../pics/hi.png out --tessdata-dir ./tessdata digits
即。通过设置我运行tesseract的路径。但是如何在pytesser调用tesseract的行中包含这条路径(最好是绝对路径)?它看起来如下
args = [tesseract_exe_name, input_filename, output_filename,'nobatch', '/prog/tessdata/configs/digits']
哪个不起作用。仅使用数字作为路径从公共程序和文件存档中绘制数字文件,这是我不想要的。
在这里包含绝对路径以告诉tesseract从何处绘制配置文件的方法是什么?或者那是不可能的?任何提示都将非常感谢!
答案 0 :(得分:0)
所以我觉得我在这里找到了答案: https://docs.python.org/2/library/subprocess.html#subprocess.Popen
import shlex
arg_str = 'tesseract ../pics/hi.png out --tessdata-dir ./tessdata digits'
args = shlex.arg_str
完成工作,只需要分开的字符串。