此问题之前已被问过,但每个解决方案似乎都是根据其目的定制的,所以我想知道是否有任何了解OCR的人可以帮助我找到合适的。
我希望用iPhone相机识别价格标签。 我尝试过将tesseract用于“仅限数字”模式(没有任何修改/训练),但99%的时间都失败了。
那么,这里适合什么呢?培训tesseract有很多价格标签/字体的图像?
也许使用openCV并用数千张图像训练它?
也许你知道可以做到的另一个引擎?
这个方向有很多方向,我不知道从哪里开始......
(编辑:我正在寻找一个开源解决方案。不是远程服务.. )
谢谢,Roey。
答案 0 :(得分:0)
我可以告诉你,培训不是你的解决方案,因为它将输入转换为直方图,与实际的文本识别无关。我认为openCV确实有一些特定于OCR的方法,我确信它有一个与iOS兼容的框架here。
答案 1 :(得分:0)
您是否尝试过使用tesseract的GPUImage开源库? GPUImage库的链接是https://github.com/BradLarson/GPUImage。为什么你不能尝试像https://code.google.com/p/simple-iphone-image-processing这样的图像处理库。
答案 2 :(得分:-1)
是的,还有其他引擎可以做到这一点,甚至免费。看这里:RTRSDK.com。
免责声明:我为ABBYY工作