我在iOS应用程序中使用Tesseract OCR 3.01,当我从手机库中选择图像时,我的数据准确率达到90%。但如果我使用相机中的相同图像,它会显示混乱的字母。我跟着this tutorial,请指导我,如果可以采取措施确保它适用于相机,因为它适用于图库图像。
答案 0 :(得分:3)
是的,有三件事要具体,首先,OCR适用于黑白图像而不是彩色,所以如果你可以尝试将图像转换为B& W,它会提高准确度。
第二个是尺寸和方向,你需要强制图像为640 * 480或320尺寸,这样既可以提高识别速度,又可以提高准确性。对于方向,有很多管理方式。
最后,如果有一些方法可以让用户准确指定他想要执行OCR的图像的哪个部分或哪个部分,这大大提高了准确性和时间,因为库不需要检查整个图像文本,而不是你已经指定了要搜索的部分。
PS:过去几周我一直致力于创建OCR应用。
答案 1 :(得分:2)
几乎可以肯定问题是“方向”。 Apple倾向于以一种位图形式创建图像 - 图像位布局就好像相机侧面有音量按钮的顶部和右侧。您看到的图像看起来比较宽的图像仍然如上所示,但图像中包含的EXIF对象中有一个“方向”。
我猜测tesseract没有看EXIF,但希望图像采用“标准”格式,以便文本处于阅读文本的位置。
您可以使用右上方的音量按钮拍摄的相机图像来测试我的假设。
如果它们有效,那么您需要做的是自己处理图像,并根据方向设置重新排列位。这并不是那么难,但需要您阅读vImage和/或位图上下文。