我想在我的应用程序中添加字符识别功能,这就是为什么问你什么是最好的,价格合理的OCR SDK。我查看了ABBY FineReader Engine 10.0但尚未获得试用版,正如我在官方网站上所要求的那样!
我已经下载了Asprise OCR SDK,但它无法识别西里尔文符号..
如何在我的应用程序上实现字符识别?通过使用什么样的库,SDK,API等..
答案 0 :(得分:1)
有Cunieform和谷歌的Tesseract OCR,两者都是免费的。我个人使用过Tesseract,SDK遇到了很多麻烦,所以最后决定用我的C程序中的system()
函数调用Tesseract的命令行界面。
很多人都遇到了Tesseract安装的困难,所以这里有一个简短的总结(版本2适用于我,必要时插入适当的版本):
从svn下载以下内容:tesseract-2.00.tar.gz
,tesseract-2.00.exe6.tar.gz
,tesseract-2.00.eng.tar.gz
将tesseract-2.00.tar.gz
解压缩到文件夹
解压缩tesseract-2.00.exe6.tar.gz
并移至tesseract-2.00.tar.gz
解压缩的位置。一些文件将以这种方式替换
同样解压缩tesseract-2.00.eng.tar.gz
并移至tesseract-2.00.tar.gz
,其中tessdata文件夹将被替换。
完成所有操作后,打开tesseract.dsw工作区,选择所有文件并执行“全部重建”。这需要一段时间才能发出大量警告,但希望没有错误。
使用DOS shell的命令是tesseract picture.tif textfile -l eng
。所以基本上将图像保存为TIFF文件,从程序中运行命令,然后从文本文件中读取OCR输出字符串。
答案 1 :(得分:1)
如果您不需要识别非常复杂的文档,我可以向您推荐Crystal OCR,他们根据请求向我发送了C ++ Builder示例。恕我直言,Tesseract仍然是马车,但它当然是最好的免费OCR。