从python中的图像创建表

时间:2014-03-31 22:08:06

标签: python ocr

我之前从未使用过OCR,我想知道是否有人可以为python推荐一个能够将下面的图像转换为2D数组的合适的OCR?

enter image description here

1 个答案:

答案 0 :(得分:1)

OCR代表光学字符识别。任何通用的OCR,即使是付费的高质量商业产品,在这张图片上都是非常不可靠的。我尝试了一个 - 它会产生一些点,并且由于缺少字符而将大多数其他区域保留为图片。

为了可靠地处理这个,特别是如果音量很高,我会写一个图像分析例程(如果图像是一致的)或使用一些专门的可自定义工具。具体来说,我会使用ABBYY FlexiCapture(因为我可以访问它)并创建一个快速模板来检测表格模式中的“对象”矩阵(黑色斑点)。最多工作10分钟。