我正在开发一款Android应用程序,它使用tesseract OCR来识别文本,现在我遇到的问题是,在不同的智能手机上,图像以不同的方式旋转,所以在一个版本上,它立即处于横向模式,而另一个在纵向模式下。所以现在我想智能地旋转图像,以便Tesseract可以识别文本。这只是可能的两种选择中的一种,但由于用户拍摄照片,它可能也在其中。我不希望用户每次都必须以相同的格式拍摄照片,我想旋转它以满足需要,如果可能的话,不会有太多的性能损失。
使用autorotate的Tesseract lib似乎对我不起作用。 任何人都知道如何解决这个问题。
由于
答案 0 :(得分:2)
如果这个问题仍然适合您:也许您可以提取图像的exif数据,以获得它的方向?
否则本文可能会对您有所帮助:Combined Orientation and Script Detection using the Tesseract OCR Engine。
答案 1 :(得分:1)
如果你不介意卷起袖子,http://www.leptonica.org/可能是一个很好的选择来评估字形(未检测为文本的原始Pix)并确定方向。我见过对Leptonica的Android绑定的引用。