晚安:)
我目前正在使用DevIL库,它允许我加载图像并检查每个像素的RGB值。就像个人学习项目一样,我正在尝试为我在Photoshop中制作的几张图像编写一个非常基本的OCR系统。
我成功地删除了图像中的所有扭曲,我留下了文字和数字。我目前没有寻找从输入中学习的高级神经网络。我想开始相对简单,所以我打算识别单个字符并计算这些字符中的像素。
我有两个问题:
感谢任何帮助,谢谢。
编辑:
我已将此问题标记为C ++,因为这是我目前正在使用的内容。但是,伪代码或来自其他语言的易读代码也没问题。
答案 0 :(得分:2)
flood fill算法可用于计算包含的像素,只要您将图像过滤为简单的黑色&白色位图。
话说回来,您可以通过将每个角色与您集合中每个角色的一组标准图像进行比较,测量相似度,然后选择得分最高的角色来进行角色识别。
请查看this question了解详情。
答案 1 :(得分:1)
不确定这会有所帮助,但有一个名为gocr的GPL OCR库。
答案 2 :(得分:1)
道歉,如果这离主题太远,但恕我直言Vigra(不是另一个!)是一个比DevIL更好的C ++图像处理库。