我将pytesseract用于包含英语和希伯来语的图像。在其中一些上可以正常工作,但在其他上则会发生以下错误:
回溯(最近通话最近): 文件“ C:\ Users \ User \ Desktop \ ocr.py”,第47行,在 文字= pytesseract.image_to_string(Image.open(文件名),lang =“ heb + eng”) image_to_string中的文件“ C:\ Python27 \ lib \ site-packages \ pytesseract \ pytesseract.py”,行286 返回run_and_get_output(image,'txt',lang,config,nice) 在run_and_get_output中的文件“ C:\ Python27 \ lib \ site-packages \ pytesseract \ pytesseract.py”,第194行 run_tesseract(** kwargs) 在run_tesseract中的文件“ C:\ Python27 \ lib \ site-packages \ pytesseract \ pytesseract.py”,第170行 引发TesseractError(status_code,get_errors(error_string)) pytesseract.pytesseract.TesseractError:(-1073741819,u'')
我已经安装了heb.traineddata,所以我不确定可能是什么问题。在产生此错误的那些图像上,仅使用“ eng”不会使代码失败,但是显然会返回错误结果,而忽略希伯来语文本。
为什么pytesseract无法在某些文件上工作而在其他文件上不能工作?
谢谢