标签: algorithm ocr
我有一个朋友正在启动一个新项目。他希望能够使用某种OCR来检测汉字符号并将其翻译成其他语言。为了做到这一点,他在找到可用的算法时遇到了一些障碍,因为这些符号比我们习惯的英文字符要复杂一些。
我们建议他开始研究2D卷积和傅立叶变换以开始模式识别过程,但他正在寻找一个好的起点。
不幸的是,我对OCR的了解非常有限,所以我可以传递的任何建议都可能是最有帮助的!
答案 0 :(得分:2)
查看nhocr。
(另外,还有tesseract,但我不确定他们是否真的支持CJK。)
关于SO上的OCR信息有很多问题,例如,试试this search。