在VB.Net中将图像中的图片解析为文本

时间:2011-07-08 00:08:44

标签: vb.net ocr

我只是想知道VB.Net 2008中是否有任何DLL或功能可用于解析文本到文本的图片(例如,屏幕截图),假设文本格式非常清晰(即,不像CAPTCHA类型的文字。)

2 个答案:

答案 0 :(得分:1)

如果它是令人难以置信的可读,一个未经改动的,纯粹的截图,那么最简单的(但可能是最慢的)方式是绘制每个字母(使用{{1} })到一个位图,并逐个像素地比较每个像素。考虑到OCR如何,这可能相当快,而且几乎肯定会给出100%的准确率。更好的方法是,如果你试图识别某个区域的文本,减少搜索区域并多次提高速度,如果文本是固定宽度格式并且你知道字体大小或可以计算它,那就更好了通过搜索一个小区域 - 当识别出一个字母时,你可以跳过整个区块!

如果您不知道如何进行此类图像处理,那就没问题。查看MSDN上的Graphics.DrawStringGetPixel开始,然后转到速度部分,使用SetPixel查找示例。

答案 1 :(得分:1)

到目前为止,您最好的选择是购买一些OCR软件来为您完成。这是另一种选择,尽管你必须等待: http://www.labnol.org/software/convert-scanned-pdf-images-to-text-with-google-ocr/5158/