OCR和汉字符号的算法

时间:2010-04-23 11:07:07

标签: algorithm ocr

我有一个朋友正在启动一个新项目。他希望能够使用某种OCR来检测汉字符号并将其翻译成其他语言。为了做到这一点,他在找到可用的算法时遇到了一些障碍,因为这些符号比我们习惯的英文字符要复杂一些。

我们建议他开始研究2D卷积和傅立叶变换以开始模式识别过程,但他正在寻找一个好的起点。

不幸的是,我对OCR的了解非常有限,所以我可以传递的任何建议都可能是最有帮助的!

1 个答案:

答案 0 :(得分:2)

查看nhocr

(另外,还有tesseract,但我不确定他们是否真的支持CJK。)

关于SO上的OCR信息有很多问题,例如,试试this search