从图像中解析/刮取信息

时间:2011-11-08 15:02:51

标签: image-processing ocr

我正在寻找一个有助于从下图中获取信息的库。 我需要当前值,所以它必须识别左边的值,然后估计底线的值。

任何想法,如果有一个库可以做这样的事情?语言并不重要,但我想Python会更好。

由于

Image to Scrape

1 个答案:

答案 0 :(得分:0)

我不知道任何“开箱即用”的解决方案,我怀疑是否存在。如果你只有图像,那么你需要做一些图像处理。一个简单的二值化方法(如Otsu二值化)将使处理更容易:

Binarized image

二值化使得它更容易,因为现在像素是“开”或“关”。

可以通过搜索水平全部的一些像素(在x轴上迭代时连续5个?)来找到线条的位置。

然后一个可能的解决方案是将图像传递给OCR引擎以获取数字(tesseractOCR是一个托管在Google(C ++)上的开源OCR引擎:tesseractOCR)。你仍然必须通过迭代来找出图像中数字的位置。

然后,您必须找到相对于左侧按键的线条的位置并进行一些数学计算,您就可以得到答案。

OpenCV是一个强大的计算机视觉库,具有二值化等功能。它也是一个C ++库。

希望有所帮助。