我有一个文字图片,其中的文字是概述而不是填写.Tesseract正在努力让任何一个词得到正确的解决 - 有没有人能解决这些类型的问题?
我尝试过像倒置这样的简单操作,但没有任何影响。我猜测tesseract已经处理了这个问题。
Img示例:
Next的典型输出:新增
Previous的典型输出:P fl evuows
(我非常简单)Code,将图像作为参数:
import pytesseract
import sys
from PIL import Image
print(pytesseract.image_to_string(Image.open(sys.argv[1])))
print(sys.argv[1])
编辑:应用threshold binary可以让我接下来,但似乎没有上一次。
答案 0 :(得分:2)
这对您来说可能为时已晚,但它会帮助看到此内容的任何人。我有同样的问题,我修复了它。 (解决方案是使用 OpenCV)
首先,使用二进制阈值。使用正确的值,您的字母不应该接触,这应该可以正常工作。这是特别的,所以你可以成功填充,而不是卡在褪色的灰色上(这似乎是你之前尝试过的情况)
此后,用黑色填充。由于您的字母不接触边框,因此应该填充所有内容,尽管在我这样做时,我不得不对图像中的每个最外层像素调用 floodfill。
最后,翻转图像颜色。这可以通过 cv2.bitwise_not() 来完成。现在它应该可以用于 OCR。