Question

我只是试图编写一个简单的程序来对整个页面进行OCR，但是我遇到了编码错误，而我在修复时总是遇到麻烦。

我的代码：

from PIL import Image
import pytesseract

text = pytesseract.image_to_string(Image.open('005.png'))
print(text)

我的错误：

文件“ c：/ Users / Dylan C / Desktop / Comparitor / image.py”，第4行，在打印（文字）

第19行，编码为“ C：\ Users \ Dylan C \ AppData \ Local \ Programs \ Python \ Python35 \ lib \ encodings \ cp437.py” 返回codecs.charmap_encode（input，self.errors，encoding_map）[0]

UnicodeEncodeError：'charmap'编解码器无法对位置187中的字符'\ u2019'进行编码：字符映射到

很抱歉，如果这是一个愚蠢的问题，我刚刚下载了tesseract，并且不是编程专家。

Answer 1

由于错误状态：问题print(text)中出现-您尝试将Unicode（utf-8）文本打印到不支持它的控制台/环境中。
搜索print UnicodeEncodeError windows解决方案，例如Python, Unicode, and the Windows console

打印tesseract输出时出现编码错误

1 个答案: