ios - Tesseract OCR相机

时间：2012-08-14 11:12:58

标签： ios xamarin.ios ocr tesseract

我在iOS应用程序中使用Tesseract OCR 3.01，当我从手机库中选择图像时，我的数据准确率达到90％。但如果我使用相机中的相同图像，它会显示混乱的字母。我跟着this tutorial，请指导我，如果可以采取措施确保它适用于相机，因为它适用于图库图像。

答案 0 :(得分：3)

是的，有三件事要具体，首先，OCR适用于黑白图像而不是彩色，所以如果你可以尝试将图像转换为B＆amp; W，它会提高准确度。

第二个是尺寸和方向，你需要强制图像为640 * 480或320尺寸，这样既可以提高识别速度，又可以提高准确性。对于方向，有很多管理方式。

最后，如果有一些方法可以让用户准确指定他想要执行OCR的图像的哪个部分或哪个部分，这大大提高了准确性和时间，因为库不需要检查整个图像文本，而不是你已经指定了要搜索的部分。

PS：过去几周我一直致力于创建OCR应用。

答案 1 :(得分：2)

几乎可以肯定问题是“方向”。 Apple倾向于以一种位图形式创建图像 - 图像位布局就好像相机侧面有音量按钮的顶部和右侧。您看到的图像看起来比较宽的图像仍然如上所示，但图像中包含的EXIF对象中有一个“方向”。

我猜测tesseract没有看EXIF，但希望图像采用“标准”格式，以便文本处于阅读文本的位置。

您可以使用右上方的音量按钮拍摄的相机图像来测试我的假设。

如果它们有效，那么您需要做的是自己处理图像，并根据方向设置重新排列位。这并不是那么难，但需要您阅读vImage和/或位图上下文。