Tesseract& OpenCV - 处理图像

时间:2016-12-07 04:59:34

标签: opencv ocr tesseract

我正在尝试处理我用tesseract录制的黑板图像,但我没有运气。我考虑过进行预处理以帮助改善我们的结果,但我不确定要采用哪种方法。

这是我的图像:

enter image description here

以下是我正在运行的tesseract命令:

convert 468.jpg  -bordercolor black -border 20x20 468-b.jpg
tesseract 468-b.jpg - -psm 11

请注意,它不必正确处理所有数学符号,但至少得到1 + 4 = 52 x 12 = 24 x 1

我之前的照片只使用这些命令效果很好。这是照片:

enter image description here

以下是它吐出的结果:

I+I

2+2m

它并不完美,但它比我之前获得的要好得多。如何改善新黑板图像的效果?我是否需要使用OpenCV,如果是这样,示例实现将非常非常有用

提前致谢

P.S。以下是我在Tesseracts GitHub上提出的原始问题,这些问题可以让我获得更好的结果:

https://github.com/tesseract-ocr/tesseract/issues/468

1 个答案:

答案 0 :(得分:3)

tesseract无法很好地识别手写图像。所以我认为你应该使用深度学习来识别手写图像。

以下是您感兴趣的教程。

https://www.tensorflow.org/versions/r0.12/tutorials/mnist/beginners/index.html#mnist-for-ml-beginners