我使用Tesseract OCR Library开发了OCR应用程序,并参考了以下链接。
但我有时会得到垃圾数据。任何人都可以帮助我做些什么来进一步获得准确的结果。
答案 0 :(得分:1)
如果您想获得针对您的案例的特定帮助以及您正在使用的任何代码,您应提供测试图像,但获得准确结果的一般经验法则是:
使用高分辨率图像(如果需要)300 DPI最小
确保图像中没有阴影或弯曲
如果有任何偏斜,您需要在ocr之前的代码中修复图像
使用字典帮助取得好成绩
调整文字大小(12磅字体是理想的)
将图像二值化并使用图像处理算法消除噪音
除此之外,还有很多图像处理功能,可以帮助提高视觉效果,例如偏移校正,透视校正,线条去除,边框去除,点去除,去除斑点等等。在你的形象。