应用错误收集

嵌入式/可编写脚本的OCR引擎有哪些选项？

时间：2011-08-15 16:41:42

标签： open-source ocr

我正在研究Python / Django Web应用程序，我需要从扫描文档中提取文本（用于搜索索引）。

OCR引擎有哪些选择？我知道tesseract，但我对结果并不完全满意。问题也许可以通过更广泛的预处理（旋转，水平调整等）来解决。

要求：

不应要求手动调整（初始调整除外）
最好是开源，或者应该可以购买“自由”牌照
Python模块或命令行程序（或者我可以变成命令行程序的C库:)）

可替换地：

一个很好的库，可以进行图像预处理，以便像tesseract这样的现有引擎能够更好地运行。

1 个答案:

答案 0 :(得分：1)

Tesseract本身可以选择与Leptonica一起编译，Leptonica是一个具有非常详尽的图像处理集的库（我不确定Tesseract本身是否将其用于支持除了基本TIF格式之外的任何其他内容）。可以在the website.上找到完整的功能列表。项目作者Dan Bloomberg撰写了一些关于OCR图像预处理的论文，您可能也对此感兴趣 - 您可以通过{ {1}}谷歌搜索。