我正在学习OCR并阅读本书https://www.amazon.com/Character-Recognition-Different-Languages-Computing/dp/3319502514
作者定义了8个实现OCR的过程,逐个跟踪(2个后1个,3个后2个等):
这是他们写的关于表示的内容(#5)
第五个OCR组件是表示。图像表示 在任何识别系统中扮演最重要的角色之一。在 最简单的情况,灰度级或二进制图像被馈送到 识别器。但是,在大多数识别系统中 避免额外的复杂性并提高算法的准确性, 需要更紧凑和特征性的表示。为了这 目的,为每个帮助的类提取一组功能 区别于其他类,同时保持不变 课堂内的特征差异。人物形象 表示方法一般分为三大类 群体:(a)全球转型和系列扩张(b)统计 表示和(c)几何和拓扑表示。
这是他们写的关于特征提取的内容(#6)
第六个OCR组件是特征提取。的目标 特征提取是捕获符号的基本特征。 特征提取被认为是最困难的问题之一 模式识别。最直接的描述方式 字符是由实际的光栅图像。另一种方法是提取 某些特征表征符号但却留下了不重要的特征 属性。提取这些特征的技术是分开的 分为三组。 (a)点(b)变换的分布 和系列扩展和(c)结构分析。
我完全糊涂了。我不明白什么是代表。正如我在分割后所理解的那样,我们必须从图像中获取一些特征,例如像弗里曼链码这样的拓扑结构,并且必须与学习阶段模型中保存的一些特征相匹配 - 即进行识别。换句话说 - 分割 - 特征提取 - 识别。我不明白在代表阶段必须做些什么。请解释一下。
答案 0 :(得分:1)
表示组件获取通过分段生成的光栅图像,并将其转换为保留类的特征属性的更简单格式(“表示”)。这是为了以后降低识别过程的复杂性。你提到的弗里曼链代码就是这样一种代表。
一些(大多数?)作者将表示和特征提取混合到一个步骤中,但是您的书的作者选择单独处理它们。更改表示不是强制性的,但这样做会降低复杂性,从而提高培训和识别步骤的准确性。
通过这种简单的表示,在特征提取步骤中提取特征。提取哪些特征取决于所选择的表示。本文 - Feature Extraction Methods for Character Recognition - A Survey - 描述了11种不同的特征提取方法,可以应用于4种不同的表示。
提取的特征是传递给训练者或识别者的内容。