OCR - 如何从概述的单词中获取文本

时间:2016-06-23 19:59:47

标签: python opencv python-imaging-library ocr tesseract

我有一个文字图片,其中的文字是概述而不是填写.Tesseract正在努力让任何一个词得到正确的解决 - 有没有人能解决这些类型的问题?

我尝试过像倒置这样的简单操作,但没有任何影响。我猜测tesseract已经处理了这个问题。

Img示例:enter image description here enter image description here
Next的典型输出:新增 Previous的典型输出:P fl evuows

(我非常简单)Code,将图像作为参数:

import pytesseract
import sys
from PIL import Image

print(pytesseract.image_to_string(Image.open(sys.argv[1])))
print(sys.argv[1])

编辑:应用threshold binary可以让我接下来,但似乎没有上一次。

1 个答案:

答案 0 :(得分:2)

这对您来说可能为时已晚,但它会帮助看到此内容的任何人。我有同样的问题,我修复了它。 (解决方案是使用 OpenCV)

首先,使用二进制阈值。使用正确的值,您的字母不应该接触,这应该可以正常工作。这是特别的,所以你可以成功填充,而不是卡在褪色的灰色上(这似乎是你之前尝试过的情况)

此后,用黑色填充。由于您的字母不接触边框,因此应该填充所有内容,尽管在我这样做时,我不得不对图像中的每个最外层像素调用 floodfill。

最后,翻转图像颜色。这可以通过 cv2.bitwise_not() 来完成。现在它应该可以用于 OCR。