使用Tesseract OCR和tess-two时会产生垃圾

时间:2016-08-31 07:43:12

标签: android ocr tesseract tess-two

我使用Tesseract OCR Library开发了OCR应用程序,并参考了以下链接。

  1. android-ocr
  2. tesseract
  3. 但我有时会得到垃圾数据。任何人都可以帮助我做些什么来进一步获得准确的结果。

1 个答案:

答案 0 :(得分:1)

如果您想获得针对您的案例的特定帮助以及您正在使用的任何代码,您应提供测试图像,但获得准确结果的一般经验法则是:

  • 使用高分辨率图像(如果需要)300 DPI最小

  • 确保图像中没有阴影或弯曲

  • 如果有任何偏斜,您需要在ocr之前的代码中修复图像

  • 使用字典帮助取得好成绩

  • 调整文字大小(12磅字体是理想的)

  • 将图像二值化并使用图像处理算法消除噪音

除此之外,还有很多图像处理功能,可以帮助提高视觉效果,例如偏移校正,透视校正,线条去除,边框去除,点去除,去除斑点等等。在你的形象。