我正致力于识别ISBN号码的iPhone应用程序(ISBN:978-83-7380-900-0) 我为此使用tesseract,但效果不佳。我可以看到其他应用程序,使用相同的引擎更好地工作。
限制我使用此配置行的字符: tess-> SetVariable(“tessedit_char_whitelist”,“SN:0123456789X-”); 所以所有“我”都被转换为“1”,而“B”则转换为8.使用它,这些字母不会出错,这对我来说并不重要。 之后,我使用正则表达式找到识别文本的正确部分。
我也裁剪图像,所以超正方体只识别图像,其中,国际标准书号是可见的部分(i放置在照相机覆盖彩色矩形,所以用户不得不放在正确的位置代码) 我还将图像调整为1000px宽度(也尝试了其他尺寸)
当光线非常出色时效果很好,但是当光线不完美时,很难正确识别。
isbn数字的最后一位是控制和。
我能做些什么才能让它更好用? 有没有什么方法可以说只是在给定的正则表达式中识别文本? 也许我应该首先对图像做些什么?
无法正确识别的样本图像:
http://img412.imageshack.us/i/img0367si.jpg/
http://img264.imageshack.us/i/img0361d.jpg/
答案 0 :(得分:3)
我使用了一些预处理,结果目前非常好。 (标准化和自动阈值)我用iphone进行简单的图像处理。我也用2倍变焦制作图像。 唯一的问题是制作模糊图像非常容易,然后无法识别任何东西。 ocr识别过程大约需要4s。它适用于300 x 109:19KB的图像 我只是想知道我能做些什么来让它更快地工作,所以我可以拍摄几张图像并处理所有这些图像。