我正在使用tesseract对每个图像只包含单个字符的图像进行光学字符识别,但我在识别某些字符方面遇到了一些问题。
我正在从较大的图片中裁剪字符,并使用pbm
使用convert
扩展名保存它们。以下是一些示例图片:
这是四个单独的图像。字母“S”,“P”和“E”被正确识别,但字母“T”未被识别。其他角色也有问题。以下是我使用tesseract的方法:
tesseract character.pbm stdout -l eng -psm 10
那么,有什么办法可以改善结果吗?可能会使用convert
以某种方式修改图片吗?