标签: java image image-manipulation ocr text-extraction
有没有人知道任何图书馆(最好是Java,但我会看一下)可以让我分开图片中的文字并为每个单词创建更小的图像?我已经测试了GOCR和tesseract,但我不打算转录文本,在许多情况下,例如手写笔记或打字机功能不佳,文本必须由人类转录。大多数文本都是西班牙文的事实也使OCR更加困难。我搜索了stackoverflow存档但没有找到任何东西。我的问题的目的是在大学我们有成千上万的旧手写笔记,如果我可以将它们逐字逐句分解成较小的图像,那么我们就可以尝试抄录和翻译它们。
答案 0 :(得分:3)
http://sourceforge.net/projects/javaocr/
特别是,下面的屏幕截图似乎与您所追求的内容有关。