实时图像处理(OCR)

时间:2013-03-27 10:13:50

标签: iphone ios image-processing ocr augmented-reality

我计划开发像Word Lens这样的应用。任何人都可以建议我可以使用的好图书馆吗?或任何人解释Word Lens App背后的技术?是卷轴时间图像匹配还是OCR?我知道一些图像处理库,如OpenCv,tesseract ...非常感谢任何帮助...

1 个答案:

答案 0 :(得分:42)

我是Word Lens的创作者之一。虽然有一些OCR库(如tesseract),但我们决定自己创建,以获得更好的结果和性能。我们的通用算法是这样的:

  1. 从相机复制图像并获取其灰度分量
  2. 使图像变平,使文字在背景中明显突出
  3. 在看起来像角色的东西周围画框。句
  4. 执行OCR:将每个框中的像素与字符数据库相匹配 - 这实际上很难!
  5. 将字符收集到单词中,在字典中查找(这也很难,因为OCR中会出现错误)
  6. 将结果绘制回图像
  7. 图像匹配本身并不够好,因为那里有各种各样的字体,文字和语言。

    OpenCV是一个很好的图书馆,可以启动和运行,并且可以了解更多有关计算机视觉的信息。我建议建立他们的例子,并在那里玩。玩得开心!