为什么Tesseract Tool for Android在许多情况下不起作用

时间:2014-04-02 17:18:00

标签: android ocr tesseract tess-two

我正在尝试实现Tesseract库以从图像中获取文本,它在某些情况下有效但在大多数情况下失败。

我在Android项目中使用此库:https://github.com/rmtheis/tess-two

我正在尝试使用此图片

enter image description here

实际结果

enter image description here

预期结果

  

维基百科

     

免费的百科全书

有关为什么不起作用的任何建议?

1 个答案:

答案 0 :(得分:0)

因为以下原因无法正常工作:

  • 图像中的不均匀照明
  • 地球图形的一部分位于捕获图像的顶部。

通过拍摄屏幕图片,您可以在拍摄的图像上引入一些较暗的区域。要修复它,您可以直接使用图像而不是拍照,或者您可以在应用中添加代码以调整不均匀照明。

使用不同的照明,并在文本区域周围裁剪,我得到了更好的结果:

OCR result showing correct recognition