打印tesseract输出时出现编码错误

时间:2019-02-28 17:29:13

标签: python python-imaging-library tesseract

我只是试图编写一个简单的程序来对整个页面进行OCR,但是我遇到了编码错误,而我在修复时总是遇到麻烦。

我的代码:

from PIL import Image
import pytesseract

text = pytesseract.image_to_string(Image.open('005.png'))
print(text)

我的错误:

文件“ c:/ Users / Dylan C / Desktop / Comparitor / image.py”,第4行,在     打印(文字)

第19行,编码为“ C:\ Users \ Dylan C \ AppData \ Local \ Programs \ Python \ Python35 \ lib \ encodings \ cp437.py” 返回codecs.charmap_encode(input,self.errors,encoding_map)[0]

UnicodeEncodeError:'charmap'编解码器无法对位置187中的字符'\ u2019'进行编码:字符映射到

很抱歉,如果这是一个愚蠢的问题,我刚刚下载了tesseract,并且不是编程专家。

1 个答案:

答案 0 :(得分:0)

由于错误状态:问题print(text)中出现-您尝试将Unicode(utf-8)文本打印到不支持它的控制台/环境中。
搜索print UnicodeEncodeError windows解决方案,例如Python, Unicode, and the Windows console