使用pytesseract时出现TesseractError:(-1073741819,u'')

时间:2018-07-19 08:14:52

标签: python ocr tesseract hebrew python-tesseract

我将pytesseract用于包含英语和希伯来语的图像。在其中一些上可以正常工作,但在其他上则会发生以下错误:

  

回溯(最近通话最近):     文件“ C:\ Users \ User \ Desktop \ ocr.py”,第47行,在       文字= pytesseract.image_to_string(Image.open(文件名),lang =“ heb + eng”)     image_to_string中的文件“ C:\ Python27 \ lib \ site-packages \ pytesseract \ pytesseract.py”,行286       返回run_and_get_output(image,'txt',lang,config,nice)     在run_and_get_output中的文件“ C:\ Python27 \ lib \ site-packages \ pytesseract \ pytesseract.py”,第194行       run_tesseract(** kwargs)     在run_tesseract中的文件“ C:\ Python27 \ lib \ site-packages \ pytesseract \ pytesseract.py”,第170行       引发TesseractError(status_code,get_errors(error_string))   pytesseract.pytesseract.TesseractError:(-1073741819,u'')

我已经安装了heb.traineddata,所以我不确定可能是什么问题。在产生此错误的那些图像上,仅使用“ eng”不会使代码失败,但是显然会返回错误结果,而忽略希伯来语文本。

为什么pytesseract无法在某些文件上工作而在其他文件上不能工作?

谢谢

0 个答案:

没有答案