使用连接的轮廓或单独的符号训练tesseract?

时间:2015-05-26 09:01:02

标签: c++ opencv image-processing ocr tesseract

我正在尝试用tesseract识别一些文字,但准确性仍然是不可接受的。问题是字体小而薄,字母间距短,并且在所有图像处理(调整水平,阈值,变换)之后,一些字母与其他字母连接或者甚至被切割成两个轮廓。下一图像是准备识别的处理图像的示例。

主要问题是我是否应该使用像“HUM”这样的整个连接轮廓或单独的符号训练tesseract?

非常感谢所有关于图像处理和识别的一般想法!

0 个答案:

没有答案