我正在开发一个生成和读取表单的文档处理应用程序。附加的样本表格作为打印文档生成,由人填写,扫描并反馈给应用程序以检测填充值,包括光学标记(气泡),文本(OCR)等。Click here for Sample Form。
由于扫描在旋转,缩放和平移方面扭曲图像,我使用三个标记来检测方向并以相当原始的方式校正图像,这在计算和存储方面非常昂贵。以下是它的要点:
以上是一种非常准确但效率低下的处理方法,我希望采用几何方法来仅提取blobs,过滤掉标记/气泡,并使用简单的数学计算气泡相对于标记的预期位置。这应该将处理时间减少80%,内存使用量减少60%。
或者,有一种方法可以在单个图像上应用所有三个变换而不会影响下一个图像。这也将减少blob检测三次的需要。
答案 0 :(得分:0)
我会对图像建模并在内存中对该模型进行转换而不是实际图像。然后,一旦计算出变换矩阵,就可以将其应用于实际图像以进行OCR。