光学字符识别开发

时间:2014-04-14 05:39:01

标签: matlab image-processing ocr feature-detection feature-extraction

我一直在尝试自己开发OCR引擎。在研究了这个主题后,我得出结论,涉及到4个主要步骤:

  1. 预处理图像[去偏斜,图像对比,二值化等]
  2. 将图像分割为字符[以便更容易分别处理每个字符]
  3. 通过特征提取/比较和分类来识别字符。
  4. 对图像进行后处理[以增加获得最佳解决方案的机会。]
  5. 第一步后我绝望地失去了!有人可以通过告诉如何进行角色隔离来帮助我。特征提取 ?即使你能给我一个指向正确方向的链接,我也将非常感激。 提前致谢! :)

2 个答案:

答案 0 :(得分:1)

Zelnik-Manor和Perona有一篇名为自调谐光谱聚类的论文。以下是用Matlab编写的纸张和代码页面的链接:

Self-Tuning Spectral Clustering

此方法可以执行图像分割。您可能想要研究的另一件事是对图像进行特征提取的主题建模。 Blei的任何东西也都会有用。

答案 1 :(得分:0)

计算机视觉系统工具箱现在具有ocr功能,可以帮助您解决问题。