如何正确定位从无人机拍摄的这些字母图像。我在opencv中尝试过fitellipse函数,但它有时会以符号方式拟合椭圆,导致以错误的方式旋转字母。
the ellipse fits it horizontally
Another example which when rotated wont give the proper letter
letter 'D' after orientation letter 'U' after orientation
cv2.fitellipse给出椭圆的长轴与y轴(逆时针方向)形成的角度。我将图像逆时针旋转180度,重新定位,即使椭圆垂直/平行于y轴。
我正在做这一切,因为tesseract ocr没有正确识别这些迷失方向的字母,即使在它的" psm 10"模式,用于单字符识别。 关于如何重新定位这些字母的任何建议,或者如何让tesseract与迷失方向的字母一起工作将会有很大的帮助!
答案 0 :(得分:0)
如果没有关于您正在寻找什么的领域知识,您的方法将无法运作。你不能简单地假设你采取的任何字母,椭圆拟合会给你答案 - 对称字母怎么样?可以使这封信看起来扁平化的观点怎么样?您甚至可以使用FFT或PCA从像素中获取主轴,从而创建字母并估计其旋转,但出于同样的原因,它不会比椭圆拟合好得多。
一种可能的解决方案是旋转和缩放不变模式匹配,您可以尝试在图像中找到所有可能的字母,但它可能会给您一些误报,并且仅适用于单个(或类似)字体系列。如果失败,我会转向基于机器学习的方法,例如SVM。