修改图像以获得更好的OCR

时间:2016-04-21 15:09:00

标签: imagemagick ocr tesseract

我正在使用tesseract对每个图像只包含单个字符的图像进行光学字符识别,但我在识别某些字符方面遇到了一些问题。

我正在从较大的图片中裁剪字符,并使用pbm使用convert扩展名保存它们。以下是一些示例图片:

Letter S Letter T Letter P Letter E

这是四个单独的图像。字母“S”,“P”和“E”被正确识别,但字母“T”未被识别。其他角色也有问题。以下是我使用tesseract的方法:

tesseract character.pbm stdout -l eng -psm 10

那么,有什么办法可以改善结果吗?可能会使用convert以某种方式修改图片吗?

0 个答案:

没有答案