Pytesseract无法读取屏幕截图上的数字

时间:2020-06-01 15:09:47

标签: python image ocr python-tesseract

您好,您可以找出pytesseract无法读取此数字的原因,我的结果是:cre

Screenshot

pytesseract.pytesseract.tesseract_cmd = "C:\\Users\\X\\AppData\\Local\\Tesseract-OCR\\tesseract.exe"
im = pyautogui.screenshot(region=(265, 110, 50, 20))
im.save("screenshot.png")
print(pytesseract.image_to_string(Image.open("screenshot.png")))

有人知道我可以如何改善结果吗?

1 个答案:

答案 0 :(得分:1)

您应该在运行Tesseract(带有opencv库的python代码)之前对图像进行预处理:


    import cv2

    pytesseract.pytesseract.tesseract_cmd = "C:\\Users\\X\\AppData\\Local\\Tesseract-OCR\\tesseract.exe"
    im = pyautogui.screenshot(region=(265, 110, 50, 20))
    im= cv2.bitwise_not(im)
    im.save("screenshot.png")
    print(pytesseract.image_to_string(Image.open("screenshot.png")))

enter image description here