我想为自己的语言开发OCR软件。我来自孟加拉国,我想为Bangali开发OCR。请帮助我并告诉我从哪里开始以及如何开始。我会适合你的帮助。
答案 0 :(得分:1)
这是一项令人钦佩的努力,也是一项艰巨的任务。今天,即使是领先的OCR技术制造商也在努力使用不可分离的字体,每个字的字符都是互相连接的。由于没有字符分离,因此与单词中具有单独字符的语言相比,模式分析或基于像素的匹配更难。对我来说,这将是这一发展中最难的部分。
要开始开发OCR系统,与什么语言无关,关于这个主题有很多基础知识。图像处理有不同的算法和方法。谷歌为它,我相信会有数百种资源出现。
如果您在此过程中遇到更具体的问题,我相信社区会尽力提供帮助。
Ilya Evdokimov