我正在做关于DSP的任务。我想将DSP应用于OCR。我在互联网上搜索但发现并不多。请给我一些关于此的关键或文档。我不知道如何将图像文件转换为数字信号。我知道图像存储为数字数据。但我不知道计算机中的文件和我在DSP中学到的东西之间的联系(信号,变换,过滤器......)。
答案 0 :(得分:1)
数字信号处理是通过逻辑算法过程进行模式处理的研究。
它涉及测量,统计数据,几何图形以及许多其他您尚未意识到的简单数字任务。
模式通常是2D图形,3D,声音,具有各种位深度和分辨率... 问题:如何将图像文件转换为数字信号?图像文件是X,Y图形。您通常会通过循环阅读它们。您期待什么?
您可以将某些图像表示为矢量。您也可以在PC中将文字表示为矢量,例如“ L”是两个矢量。
99%的通用图像DSP使用矢量和栅格。
因此,当您谈论OCR信号处理时,请考虑一下人脑如何识别字母。
学徒读者首先找到该线,然后向前穿过该线。
他们使用每个字母周围的空格来选择单个字母。
然后他们将字母与记忆进行比较,以回忆是否是A,a,B,b,C,c。
这为您提供了一种计算机执行此操作的方法。
查找字符行。它们具有较长的水平间距,很容易在XY循环中看到。
元素,这些元素由垂直分隔符分隔。
使用最简单的OCR科学比较该字符。
OCR仅代表DSP科学的一百万分之一,但OCR可能拥有数十个博士学位,网络教程和github项目供您搜索。
您已识别1.2.3。在逻辑过程的各个步骤中,您可以比较其他方法并从中学习,然后您将阅读有关OCR的2页内容。到您在OCR上扫描10,20或100页时,您可能会发现一些精美插图的网页使您不寒而栗,使您成为DSP OCR的天才。
答案 1 :(得分:-1)
如果您打算使用Matlab。这是做到这一点的方法。你阅读图像并找到它的描述符。字母表中的每个字母都应该有自己独特的描述符。
I=imreadbw('data/box.jpg') ;
[f,d,gss,dogss] = sift(I,'verbosity',1,'boundarypoint',0,'threshold',.0282,'firstoctave',-1,'edgethreshold',0) ;
d = uint8(512*d) ;