应用错误收集

时间：2010-12-22 21:19:27

标签： java ocr

这个问题可能超出了堆栈溢出的简单答案的范围，但我希望它能让我能够制定几个更具体的问题来获得我需要的地方是

我想编写一个程序，在缓冲的图像中搜索文本并将其作为字符串返回。我不想编写整个OCR程序，而是希望使用免费提供的API，例如tesseract。不幸的是，我一直无法找到tesseract的Java API。

我知道字体是arial，我知道它的大小。我想知道这是否会有所帮助。

我已经设法捕获了屏幕，但我不确定如何完成识别图像中找到的文本的下一步。

问题

如何在我的java程序中实现简单的OCR功能？

答案 0 :(得分：3)

您可以使用Tesseract API的tesjeract或tess4j包装。请务必将图像重新缩放至300 DPI，因为屏幕截图的分辨率（72或96 DPI）通常不足以满足OCR目的。

答案 1 :(得分：2)

OCR实现很复杂，但使用像http://asprise.com/product/ocr/index.php?lang=java这样的SDK很简单。