应用错误收集

我正致力于识别ISBN号码的iPhone应用程序（ISBN：978-83-7380-900-0）我为此使用tesseract，但效果不佳。我可以看到其他应用程序，使用相同的引擎更好地工作。

限制我使用此配置行的字符： tess-＆gt; SetVariable（“tessedit_char_whitelist”，“SN：0123456789X-”）; 所以所有“我”都被转换为“1”，而“B”则转换为8.使用它，这些字母不会出错，这对我来说并不重要。之后，我使用正则表达式找到识别文本的正确部分。

我也裁剪图像，所以超正方体只识别图像，其中，国际标准书号是可见的部分（i放置在照相机覆盖彩色矩形，所以用户不得不放在正确的位置代码）我还将图像调整为1000px宽度（也尝试了其他尺寸）

当光线非常出色时效果很好，但是当光线不完美时，很难正确识别。

isbn数字的最后一位是控制和。

我能做些什么才能让它更好用？有没有什么方法可以说只是在给定的正则表达式中识别文本？也许我应该首先对图像做些什么？

无法正确识别的样本图像：
http://img412.imageshack.us/i/img0367si.jpg/
http://img264.imageshack.us/i/img0361d.jpg/

如何改善tesseract识别数字的结果

1 个答案: