任何人都可以使用matlab从具有透视失真的图像中了解不同的文本检测方法,或者任何代码都可用。是opencv优于matlab进行文本检测
答案 0 :(得分:2)
我认为,matlab适用于文本检测(ocr)。 有一些ocr的库。最重要的是:
Tesseract被认为是目前最准确的开源OCR引擎之一。
我使用透视失真处理ocr并使用matlab-tesseract库。
我通过使用houghlines方法查找图像边框及其线条来处理旋转图像的透视扭曲问题。
我将分享我的代码片段,我希望它能为您提供有关该问题的愿景
function [ output_args ] = rotate_image( )
clc;
close all;
clear;
I = imread("any_images")
I2 = imcrop(I,[85 150 590 480]);
I3 = imcrop(I2,[-85 0 440 480]);
imwrite (I3,'original.tiff', 'Resolution', 300);
thresh = graythresh(I3);
Bimage = im2bw(I3, thresh);
Bimage = edge(Bimage,'sobel');
[H, T, R] = hough(Bimage);%,'RhoResolution',0.1,'Theta',[-90,0]);
P = houghpeaks(H,10);%,'threshold',ceil(0.3*max(H(:))));
% Find lines and plot them
lines = houghlines(Bimage,T,R,P);%,'FillGap',100,'MinLength',5);
figure, imshow(I3), hold on
max_len = 0;
for k = 1:length(lines)
xy = [lines(k).point1; lines(k).point2];
len = norm(lines(k).point1 - lines(k).point2);
if ( len > max_len)
max_len = len;
xy_long = xy;
end
end
% highlight the longest line segment
plot(xy_long(:,1),xy_long(:,2),'LineWidth',2,'Color','blue');
a = -xy_long(1,1) + xy_long(2,1);
b = -xy_long(1,2) + xy_long(2,2);
angle=180-atand(b/a);
if angle > 180
angle = angle-180;
end
angle
B = imresize(I3, 2);
if angle > 90
B = imrotate(B, 90 - angle ,'bilinear','crop');
else
B = imrotate(B, -angle,'bilinear','crop');
end
imwrite (B,'rotated_image.tiff', 'Resolution', 300);
end