Python无法从图像中读取文本[带有Tesseract的Python OCR]

时间:2020-05-31 16:14:22

标签: python python-3.x ocr tesseract python-tesseract

我遇到的问题是从图像中准确地读取两行数字(每行最多包含3位数字)。

我的Python代码在从以下图像读取数据时遇到了一个大问题:

enter image description here enter image description here enter image description here

在大多数情况下,它只是打印随机数。 我应该怎么做才能使这项工作?

这是我的Python代码:

from PIL import ImageGrab, Image
from datetime import datetime
from pytesseract import pytesseract
import numpy as nm


pytesseract.tesseract_cmd = 'F:\\Tesseract\\tesseract'

while True:
    screenshot = ImageGrab.grab(bbox=(515, 940, 560, 990))
    datetime = datetime.now()
    filename = 'pic_{}.{}.png'.format(datetime.strftime('%H%M_%S'), datetime.microsecond / 500000)

    gray = screenshot.convert('L')
    bw = nm.asarray(gray).copy()

    bw[bw < 160] = 0
    bw[bw >= 160] = 255

    convertedScreenshot = Image.fromarray(bw)

    tesseract = pytesseract.image_to_string(convertedScreenshot, config='digits --psm 6')

    convertedScreenshot.save(filename)

    print(tesseract)

图像必须在黑色背景上具有白色文本或在白色背景上具有黑色文本。

随后保存图像也很重要。

1 个答案:

答案 0 :(得分:0)

Tesseract在白色背景上具有黑色文本的图像上效果最佳。在添加tesseract之前,通过添加以下行来反转图像:

 convertedScreenshot = 255 - convertedScreenshot