Python pytesseract从图像中错误提取文本

时间:2018-07-17 12:14:38

标签: python python-2.7 tesseract pytesser python-tesseract

我正在尝试使用pytesseract从图像中提取文本。 但是我得到的文字不正确。 假设当我尝试阅读下图时,

A = pytesseract.image_to_string(Image.open('A.png'),config='-psm 6',lang = 'eng')

输出为:

Shoofing

我提到了“英语”一词,但仍然遇到未知字符,例如“ fi enter image description here

尽管我提到lang ='eng',但它却给出了拉丁字符。

“?”

名称:拉丁文小连字Fi Unicode号
U + FB01

0 个答案:

没有答案