“OCR”字符/短文本/数字序列

时间:2015-07-23 07:28:19

标签: c# ocr pixel

这是我的问题:我必须从位图中识别数字(例如853/52)和一些文本(包含大约8个字母的字母),我必须非常快地完成。

Tesseract可以解决这个问题,但是它的执行时间对我来说有点太慢了。由于我的字符大小和字体总是相同的数量有限,我想我可以将它们全部提取出来并为一个字符的某些特征构建一个查找表。

然而要实现这一目标,我必须能够将包含853字符的位图“拆分”为其各自的字符(有些像OCR培训师那样将它们包装起来)。

不幸的是我不知道,如何开始拳击/分离他们..任何建议将不胜感激。

1 个答案:

答案 0 :(得分:0)

谢谢你的支持。 我有点解决了我的一半问题..如果我使用Aforge我可以通过一组过滤器来运行它们,在我的情况下我在灰度和二值化之前增加对比度,然后对它们运行blob提取,这允许我切断图片。现在我有一套干净的角色形象,我只会"只有#34;必须与比较的匹配。