OCR和人工神经网络之间有什么关系?

时间:2012-04-05 14:50:34

标签: neural-network ocr feature-detection

我看到不同的文章谈到OCR表格识别(数据提取),他们说他们使用神经网络进行表格识别,那么人工神经网络(ANN)和表格识别之间的关系是什么?如果我想从BusinessCard中提取字段,是需要使用ANN还是可选的?换句话说,我什么时候需要使用人工神经网络,什么时候不需要?

3 个答案:

答案 0 :(得分:1)

ANN是执行OCR的一种方式。还有其他人。因此,如果您想使用ANN从BusinessCard中提取字段,则只能选择。

答案 1 :(得分:1)

这有点不同。 ANN只是所有OCR中的“专家”。但OCR引擎包含许多专家。当您研究ANN时,您将使用ANN构建一个简单的OCR引擎,但这与使用它与三元组,形态学,数据类型(对BCR和表格非常重要),字典,连通组件算法相结合的现代引擎无法比较等等,所以把它看作只是提取质量结果的技巧包中的工具之一。一个好的引擎将包含ANN和所有其他引擎。在BCR中还有其他注意事项,首先应该对连通组件,词典进行非常沉重的处理,然后使用ANN和模式匹配进行实际识别。

答案 2 :(得分:1)

好问题。我最近花了一些时间玩OCRopus,一个做OCR的Google项目 - 你可以免费获得它并自己玩它。我很确定它有一个人工神经网络作为其背后的模块之一。然而,光学字符识别的整个过程可以有许多步骤(许多不同的小模块,每个模块都做某事并将结果传递给下一个模块)。

所以,这里有一些我记得由该项目中的模块完成的事情:

  1. 有一个模块可以将图像转换为黑白图像 - 这使以后的模块更容易处理。
  2. 摆脱斑点/瑕疵。
  3. 理顺文字。
  4. 将文字分成单个单词(已经过了几个星期,不确定这个单词)
  5. 基本上,您可以使用不涉及神经网络的少量代码来完成上述操作。因此,使用这些小部分代码可以更简单地完成它。

    我认为神经网络仅用于识别单个字符 - 一组可能字符的特征就是它。

    OCRopus中有一个训练命令我已经运行了一个多星期,它不断发送线样本到地图,慢慢地改变地图。我认为它正在训练ANN部分。