与同一图像上的tesseract不同的结果

时间:2015-01-02 18:03:39

标签: opencv image-processing ocr tesseract

您好我正在尝试对图像进行处理。

enter image description here

这是经过一些预处理后的原始图像 (跳过预处理部分,因为它与我的问题没有真正的关系,但如果有人需要的话会分享)

我有这个图片

enter image description here

当我尝试使用tesseract

来查看此图像时

我的结果是

HN'

2809

然而,当我在photoshop上手动裁剪图像的一半时

enter image description here

我收到了

HN'

Z8
结果是

我想知道这两张图片之间的区别是什么,因为一张提供 2 而不是 Z ,而另一张提供 Z

我知道我必须平滑边缘以获得更准确的结果,但运动模糊,高斯模糊和普通模糊滤镜确实改变了我得到的结果。

1 个答案:

答案 0 :(得分:3)

Tesseract实现了一种算法,根据附近的数字和数字类型,在字母 Z 上选择数字 2

  • 在第一张图片中,它会在 Z 上猜测 2 ,因为它的邻居都是数字(809),所以它假设第一个数字也必须是一个数字。

之前我遇到过这个问题。 :(

顺便说一句,我认为您应该翻转图片的第一部分,以便HN'成为.NH