我想尝试文本识别,所以我使用opencv来查找边缘和c ++以找到斜率,曲线等,边缘算法适用于大而整齐的字符组但是当它出现时小的印刷文字或带有很多背景噪音的文字,如嵌入验证码,它会挣扎,看起来不完整,我的猜测是我没有正确设置阈值并尝试不同的值而没有成功。
这是我的代码:
#include "cv.h"
#include "highgui.h"
using namespace cv;
const int low_threshold = 50;
const int high_threshold = 150;
int main()
{
IplImage* newImg;
IplImage* grayImg;
IplImage* cannyImg;
newImg = cvLoadImage("ocv.bmp",1);
grayImg = cvCreateImage( cvSize(newImg->width, newImg->height), IPL_DEPTH_8U, 1 );
cvCvtColor( newImg, grayImg, CV_BGR2GRAY );
cannyImg = cvCreateImage(cvGetSize(newImg), IPL_DEPTH_8U, 1);
cvCanny(grayImg, cannyImg, low_threshold, high_threshold, 3);
cvNamedWindow ("Source", 1);
cvNamedWindow ("Destination",1);
cvShowImage ("Source", newImg );
cvShowImage ("Destination", cannyImg );
cvWaitKey(0);
cvDestroyWindow ("Source" );
cvDestroyWindow ("Destination" );
cvReleaseImage (&newImg );
cvReleaseImage (&grayImg );
cvReleaseImage (&cannyImg );
return 0;
}
我看过网络并看到了一些复杂的阈值条件,如本网站的代码所示:
% Set direction to either 0, 45, -45 or 90 depending on angle.
[x,y]=size(f1);
for i=1:x-1,
for j=1:y-1,
if ((gradAngle(i,j)>67.5 && gradAngle(i,j)<=90) || (gradAngle(i,j)>=-90 && gradAngle(i,j)<=-67.5))
gradDirection(i,j)=0;
elseif ((gradAngle(i,j)>22.5 && gradAngle(i,j)<=67.5))
gradDirection(i,j)=45;
elseif ((gradAngle(i,j)>-22.5 && gradAngle(i,j)<=22.5))
gradDirection(i,j)=90;
elseif ((gradAngle(i,j)>-67.5 && gradAngle(i,j)<=-22.5))
gradDirection(i,j)=-45;
end
end
end
如果这是解决方案,有人可以提供这个算法的c ++等价物吗,如果不是我能做什么呢?
答案 0 :(得分:5)
Canny边缘检测器是一个使用滞后阈值处理的多步检测器(它使用两个阈值而不是一个)和边缘跟踪(您的最后一个片段是此步骤的一部分)。我建议先阅读wikipedia条目。一种可能的解决方案是选择高阈值,例如, 70%的图像像素将被分类为边缘(最初 - 您可以使用直方图快速完成此操作),而不是选择低阈值,例如, 40%的高门槛。尝试对图像块而不是整个图像执行边缘检测可能是个好主意,因此您的算法可以计算不同区域的不同阈值。
请注意,CAPTCHA-s设计为难以分割,添加破坏边缘检测的噪声是实现此目的的一种技术(您可能需要先平滑图像)。