我已经研究过PyTesser / Tesseract,就我所知,它只在我输入图像时才给我一个字符串。
但是,我希望收到它识别的每个字符的坐标/边界矩形。字符串本身可能对我以后有用,但现在就是我需要的。
假设PyTesser / Tesseract不提供我的功能,是否可以免费获得(即,不是Matlab或类似的东西)?
答案 0 :(得分:3)
根据此mailing list thread,您可以使用Tesseract执行此操作。但是,我不知道Python包装器会授予您访问该数据的权限。
答案 1 :(得分:1)
查看最近发布到tesseract google论坛的类似问题:http://groups.google.com/group/tesseract-ocr/browse_thread/thread/70ad57cb37edabe0/
答案 2 :(得分:0)
也许你应该尝试“ocropus”: