标签: python python-2.7 tesseract pytesser python-tesseract
我正在尝试使用pytesseract从图像中提取文本。 但是我得到的文字不正确。 假设当我尝试阅读下图时,
A = pytesseract.image_to_string(Image.open('A.png'),config='-psm 6',lang = 'eng')
输出为:
Shoofing
我提到了“英语”一词,但仍然遇到未知字符,例如“ fi ”
尽管我提到lang ='eng',但它却给出了拉丁字符。
“?”
名称:拉丁文小连字Fi Unicode号 U + FB01