如何区分2个类:数字和图像上的“其他字母和噪音”?

时间:2015-02-04 15:05:23

标签: opencv machine-learning computer-vision haar-classifier anpr

我开发了一种图像识别算法,可以帮助在现实世界的脏面板上找到角色。实际上,图像是一个包含字母,数字和泥浆的汽车登记牌。

算法必须将字符分为两类:字母字符和数字。是否可以训练LBP或Haar级联来区分这两个类别,由于数字形状变化,训练结果是否稳定?

请您简单解释一下或推荐更好的方法吗?

1 个答案:

答案 0 :(得分:0)

“算法必须将字符分为两类:字母字符和数字。” - 你忘记了泥和背景,但从技术上讲,你可以将它们添加到一个广泛的类别“其他”.Harars级联用于像人脸检测这样的东西,因为它们通常是中间空间尺度上的近似小波,其中面具有特征。你的问题是不同的。你需要首先理解你的问题结构,阅读文献,然后尝试使用纯粹的学习算法。book实际上是谈论人们开始首先考虑方法,而不是分析问题并不总是一个好主意。

从技术上讲,你首先需要找到图像中的文本,这比识别它更具挑战性,因为当前的OCR技术通常用作库而不是从头开始创建。为了在图像中查找文本,我建议首先进行自适应阈值处理以创建二进制映射(1-前景,即字母和数字,0是背景),然后在前景上执行连接组件,并与SWT(笔画宽度变换){{3 }}