从图像中的文本创建单词图像

时间:2011-07-14 22:01:20

标签: java image image-manipulation ocr text-extraction

有没有人知道任何图书馆(最好是Java,但我会看一下)可以让我分开图片中的文字并为每个单词创建更小的图像?我已经测试了GOCRtesseract,但我不打算转录文本,在许多情况下,例如手写笔记或打字机功能不佳,文本必须由人类转录。大多数文本都是西班牙文的事实也使OCR更加困难。我搜索了stackoverflow存档但没有找到任何东西。我的问题的目的是在大学我们有成千上万的旧手写笔记,如果我可以将它们逐字逐句分解成较小的图像,那么我们就可以尝试抄录和翻译它们。

1 个答案:

答案 0 :(得分:3)

http://sourceforge.net/projects/javaocr/

特别是,下面的屏幕截图似乎与您所追求的内容有关。

Java OCR Image Tracer Screenshot