是否有适用于c ++构建器的OCR SDK?

时间:2011-08-05 06:10:39

标签: ocr c++builder image-recognition text-recognition

我想在我的应用程序中添加字符识别功能,这就是为什么问你什么是最好的,价格合理的OCR SDK。我查看了ABBY FineReader Engine 10.0但尚未获得试用版,正如我在官方网站上所要求的那样!

我已经下载了Asprise OCR SDK,但它无法识别西里尔文符号..

如何在我的应用程序上实现字符识别?通过使用什么样的库,SDK,API等..

2 个答案:

答案 0 :(得分:1)

有Cunieform和谷歌的Tesseract OCR,两者都是免费的。我个人使用过Tesseract,SDK遇到了很多麻烦,所以最后决定用我的C程序中的system()函数调用Tesseract的命令行界面。

很多人都遇到了Tesseract安装的困难,所以这里有一个简短的总结(版本2适用于我,必要时插入适当的版本):

  1. 从svn下载以下内容:tesseract-2.00.tar.gztesseract-2.00.exe6.tar.gztesseract-2.00.eng.tar.gz

  2. tesseract-2.00.tar.gz解压缩到文件夹

  3. 解压缩tesseract-2.00.exe6.tar.gz并移至tesseract-2.00.tar.gz解压缩的位置。一些文件将以这种方式替换

  4. 同样解压缩tesseract-2.00.eng.tar.gz并移至tesseract-2.00.tar.gz,其中tessdata文件夹将被替换。

    完成所有操作后,打开tesseract.dsw工作区,选择所有文件并执行“全部重建”。这需要一段时间才能发出大量警告,但希望没有错误。

    使用DOS shell的命令是tesseract picture.tif textfile -l eng。所以基本上将图像保存为TIFF文件,从程序中运行命令,然后从文本文件中读取OCR输出字符串。

答案 1 :(得分:1)

如果您不需要识别非常复杂的文档,我可以向您推荐Crystal OCR,他们根据请求向我发送了C ++ Builder示例。恕我直言,Tesseract仍然是马车,但它当然是最好的免费OCR。