如何从带有文本的图像中获取每个字母的图像

时间:2017-05-05 08:26:48

标签: c# .net image image-processing ocr

F.E。我们有一个扫描的文本文件。现在,我已经写了一个程序,可以获得一个字母的图像并识别它。我现在不明白的是,如何从整个扫描文档中获取每个文本符号的图像表示?有可能吗?

enter image description here

1 个答案:

答案 0 :(得分:0)

作为一项基本技术,使用二值化和连通分量分析。这将为您提供与单个字符相对应的“blob”,您可以获得它们的边界框。

你将面临额外的困难:

  • 某些角色可以触摸并形成单个blob。您将需要一些检测逻辑来分割它们,例如基于大小和/或错误的识别分数。在讨厌的情况下(几个感人的角色,宽度不均匀的字符),你将不得不尝试不同的分裂假设并保持最佳状态。

  • 某些字符由多个blob(例如重音字母)组成,有些字符可能会出现碎片。当附近有小斑点时,您可以检测到这些情况。在这里,你将不得不尝试对假设进行分组(冒险将不相关的部分分组)并保持最佳状态。

  • blob将以随机顺序报告给您,您将需要一些额外的逻辑来在读取序列中重新排序。