为单个字符/字形(OCR)实现模板匹配

时间:2012-08-21 21:42:13

标签: c# .net algorithm ocr template-matching

我正在开发一个C#OCR程序(项目用于我自己的学习目的,没有任何商业品质),它将识别希伯来字符。我计划通过将字形与图像分离然后应用模板匹配方法来实现这一目的。

我在哪里

我现在已经知道了,所以我可以将各个字形从图像中分离出来。每个字形用2D像素阵列表示。例如,角色“bet”看起来像:

..........
.*******..
.......*..
.......*..
.********.
..........

其中“。”表示空白区域,“*”表示填充的像素。

现在我要应用模板匹配算法来识别这个2D像素数组所代表的字形(在这种情况下,它应该匹配“下注”模板)。

问题

我很难找到一个好的模板匹配算法的简单解释(我发现的大部分是论文或代码库的链接),并且想知道是否有人知道我可能会学习。

我想强调一点,我想手工完成,而不是简单地使用库。我愿意研究一个图书馆如何解决这个问题,但是,如果它没有分成十五个不同的部分。 :)

我也愿意听听是否有更好的方法来做我想做的事。

1 个答案:

答案 0 :(得分:0)

为每个模板生成一个数字,因为它是像素数组,如果您将每个像素与数字相关联(如0,2,4,8,16等),则空像素为0,填充像素为1。 / p>

然后为每个字形计算总数并匹配它们。