OCR:准确识别相似的字符(变音符号)

时间:2018-02-09 07:25:36

标签: algorithm opencv machine-learning ocr theory

假设:

  • 欧洲语言扫描书籍中的黑白位图图像(在本例中为波兰语)
  • 每个字符高约20像素,宽4-18像素
  • 有限的学习样本
  • 无限制的处理时间
  • 无限记忆

任务:

  • 让计算机识别给定字体的字符,其中非常相似的字符具有最高准确度(例如带有变音符号的波兰字母:l vs ł,{{1 vs ż)?

对于计算机视觉和AI的新手,您会建议采用什么方法?我应该使用神经网络吗? CNN? OpenCV的一些算法?对矩阵进行一些数学运算?

样本数据(当然,这不是一个完整的学习样本,但它显示了挑战):

来信źż

ź

三个字母 _ _ _ _ _ _ _ _ _ _ _ % % _ _ _ _ _ _ _ _ _ _ _ _ % % % _ _ _ _ % % % _ _ _ _ _ % % % _ _ _ _ % % % _ _ _ _ _ % % _ _ _ _ _ % % _ _ _ _ _ _ % _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ _ % % % % % % _ _ % % % % % % _ % % % % % % % % % % _ % % % _ _ _ _ % % % _ _ _ _ _ % % _ _ _ _ % % % _ _ _ _ _ % % % _ _ _ _ % % _ _ _ _ _ _ % % _ _ _ _ % % % _ _ _ _ _ % % _ _ _ _ % % % _ _ % % _ % % % _ _ _ % % % % % % % % _ % % % % % % % % % % % % % % _ _ _ _ _ % % _

l

三个字母 _ % % % _ % % % _ _ _ % _ _ % % % % % % % % _ _ % % % _ _ % % _ _ % % % _ _ % % % _ _ % % _ _ % % % _ _ % % % _ _ % % _ _ % % % _ _ _ % % _ _ % % _ _ _ % % _ _ _ % % _ _ % % _ _ _ % % _ _ % % % _ _ % % _ _ _ % % _ _ % % % _ _ % % _ _ _ % % _ _ % % % _ _ % % _ _ % % % _ _ % % % _ _ % % _ _ % % % _ _ % % % _ _ % % _ _ _ % % _ _ _ % % _ _ % % % _ % % % _ _ % % % _ % % % % % % % % % % % % % % % % % % _ % % % _ % % % % %

ł

如您所见,可感知的差异只能在几个像素中。我想,挑战是让计算机比其他人更“注意”那些重要的像素。

任何建议表示赞赏。

0 个答案:

没有答案