应用错误收集

Python pytesseract从图像中错误提取文本

时间：2018-07-17 12:14:38

标签： python python-2.7 tesseract pytesser python-tesseract

我正在尝试使用pytesseract从图像中提取文本。但是我得到的文字不正确。假设当我尝试阅读下图时，

A = pytesseract.image_to_string(Image.open('A.png'),config='-psm 6',lang = 'eng')

输出为：

Shooﬁng

我提到了“英语”一词，但仍然遇到未知字符，例如“ fi ”

尽管我提到lang ='eng'，但它却给出了拉丁字符。

“？”

名称：拉丁文小连字Fi Unicode号
U + FB01

0 个答案:

没有答案