我只是试图编写一个简单的程序来对整个页面进行OCR,但是我遇到了编码错误,而我在修复时总是遇到麻烦。
我的代码:
from PIL import Image
import pytesseract
text = pytesseract.image_to_string(Image.open('005.png'))
print(text)
我的错误:
文件“ c:/ Users / Dylan C / Desktop / Comparitor / image.py”,第4行,在 打印(文字)
第19行,编码为“ C:\ Users \ Dylan C \ AppData \ Local \ Programs \ Python \ Python35 \ lib \ encodings \ cp437.py” 返回codecs.charmap_encode(input,self.errors,encoding_map)[0]
UnicodeEncodeError:'charmap'编解码器无法对位置187中的字符'\ u2019'进行编码:字符映射到
很抱歉,如果这是一个愚蠢的问题,我刚刚下载了tesseract,并且不是编程专家。
答案 0 :(得分:0)
由于错误状态:问题print(text)
中出现-您尝试将Unicode(utf-8)文本打印到不支持它的控制台/环境中。
搜索print UnicodeEncodeError windows
解决方案,例如Python, Unicode, and the Windows console