直接在Python中读取tesseracts结果

时间:2019-05-22 18:05:30

标签: python unicode python-imaging-library pyautogui python-tesseract

我很好奇我将如何使用tesseract捕获数据并在同一python文件中读取所述数据。

我目前正在将数据写入文本文件,然后将文本文件读回程序,这很痛苦。

import pyautogui
import imutils
import cv2
from PIL import Image
import pytesseract

pyautogui.screenshot("ScreenShot.png")

im = Image.open("ScreenShot.png")
text = pytesseract.image_to_string(im, lang = 'eng')

print(text)
im.close()

我希望print可以实际打印此处捕获的文本,但是它会返回此错误: UnicodeEncodeError: 'charmap' codec can't encode character '\xae' in position 128: character maps to <undefined>

我也尝试过做: text = str(text, 'UTF-8')

但是返回此错误: TypeError: decoding str is not supported

编辑:另外,如果有人对您在此处看到的其他内容有任何建议,请告诉我,我不是非常有经验,因为您可能已经猜到了,所以所有批评都是有帮助的。

0 个答案:

没有答案