我需要创建将手动填写并以数字方式阅读的表单。我打算使用一种带有行和列的scantron-esque格式,用户只需在适当的单元格中的圆圈中着色,计算机就会根据单元格矩阵中的xy位置知道该值。就像一个excel地址。
| Sys | TV | printer
---------------------------
6/12 | | X |
---------------------------
6/13 | X | |
---------------------------
6/14 | | | X
根据上面的例子,我将在6月12日有一台电视,6月13日有一个系统,等等。 所以问题是,你们中的任何人都知道一个读取这样东西的应用程序;我可以自动读取文档并保存输出而无需用户干预? 感谢
我玩了几个OCR,他们非常努力地识别屏幕上的所有文字,他们弄乱了布局,用他们对“不可读”字符的奇怪解释填补了它。这可能就是答案,但是ocr必须让我限制它试图读取或格式化的内容。
答案 0 :(得分:2)
您想要OMR(光学标记识别)。不确定你的预算是多少,但Abbyy是这个领域的领导者之一:
如果你想尝试自己动手,我上个月写了这篇文章
http://www.codeproject.com/KB/showcase/SimpleOMRDotImage.aspx
它基于我所工作的公司的工具包,但解释了核心概念,以便您可以尝试使用您拥有的任何成像工具包来实现它。
答案 1 :(得分:0)
你想要OCR软件。有一些免费图书馆供个人使用(我相信谷歌赞助商一个)。您可能想要使用布局来确保OCR清楚地识别网格。
只要你得到允许你将X排列到相应列的文本(例如,对于列电视,在X和日期之间至少有2个非数字),你应该能够解释生成的文本输出。