解析传真表格

时间:2010-09-02 02:57:14

标签: parsing ocr fax

查看将表单(仅为了简单起见,仅包含复选框)传真到能够进行OCR的传真服务器的方案。现在,有了印刷文本,我看到各种OCR实现做得不错,但我不确定如何处理复选框,特别是手写的“x”或支票,更不用说坐标了。

回到小学,我们习惯用正确的答案用HB铅笔阴影填写那些高斯(sic)测试;在某个地方,不知何故,这被解析和分析。

我们今天在哪儿?有没有开箱即用的东西?

1 个答案:

答案 0 :(得分:3)

您指的是Scantron和NCS在美国许多学校普遍使用的光学标记识别(OMR)技术。

大多数OCR服务器都没有读取OMR的真实概念,除非它专门用于识别不同的表单类型。听起来您的OCR传真服务器软件可能只进行整页OCR,并且没有OMR字段的概念。

你可以在没有投入太多精力或成本的情况下完成任务。如果按照以下指南设计问题,它可能会很有效。

你喜欢吃哪种水果?
  < >苹果
  < >梨
  < >橙色
  < >香蕉

当OCR引擎返回OCR文本时,您可以假设在<之间读取任何字符。和>即使字符是无法识别的字符,字符也是OMR标记。

你喜欢吃哪种水果?
  < >苹果
  < x>梨
  < ? >橙色
  < >香蕉

这表明Pear和Orange已被标记。

TeleForm是一个商业软件包,可以导入图像并处理传真页面,但您需要先在Teleform中设计表单。 http://www.cardiff.com/products/index.html