我正在寻找一种基于文档边框的文本识别方法。 或者可以解决寻找新观点问题的方法。 对于exmp。相机在点(x1,y1,z1)和结果图像有透视失真,但我们可以找到(x2,y2,z2)相机来校正图片。
感谢。
答案 0 :(得分:2)
通常的方法,假设文档的页面在3D空间中大致是平的,是将包含页面的四边形扭曲成矩形。为此,您必须估计homography,即原始图像与其扭曲对应物之间的(线性)投影变换。
估计需要两个图像之间的匹配点(或线),并且文档的常见选择是将原始图像中的页角映射到变形图像的图像角。这通常会产生一个长宽比不正确的矩形(即扭曲的页面看起来比实际页面“更宽”或“更高”),但如果您事先知道真正的宽高比是多少,这很容易纠正是(例如,因为您知道所用纸张的类型,无论是字母,A4等)。
执行估算的简单算法是所谓的Direct Linear Transformation。
OpenCV库包含帮助完成所有这些任务的例程,请查看它。