Question

我有一个文字图片，其中的文字是概述而不是填写.Tesseract正在努力让任何一个词得到正确的解决 - 有没有人能解决这些类型的问题？

我尝试过像倒置这样的简单操作，但没有任何影响。我猜测tesseract已经处理了这个问题。

Img示例：
Next的典型输出：新增 Previous的典型输出：P fl evuows

（我非常简单）Code，将图像作为参数：

import pytesseract
import sys
from PIL import Image

print(pytesseract.image_to_string(Image.open(sys.argv[1])))
print(sys.argv[1])

编辑：应用threshold binary可以让我接下来，但似乎没有上一次。

Answer 1

这对您来说可能为时已晚，但它会帮助看到此内容的任何人。我有同样的问题，我修复了它。（解决方案是使用 OpenCV）

首先，使用二进制阈值。使用正确的值，您的字母不应该接触，这应该可以正常工作。这是特别的，所以你可以成功填充，而不是卡在褪色的灰色上（这似乎是你之前尝试过的情况）

此后，用黑色填充。由于您的字母不接触边框，因此应该填充所有内容，尽管在我这样做时，我不得不对图像中的每个最外层像素调用 floodfill。

最后，翻转图像颜色。这可以通过 cv2.bitwise_not() 来完成。现在它应该可以用于 OCR。