我正在开发一个应用程序,它需要将扫描图像文件中的数字与数据库条目进行匹配,并使用匹配结果更新数据库。
说我有image- employee1.jpg。此图像将有两个两个手写条目 - 员工编号和支付给员工的金额。我必须从图像中读取员工编号并查询数据库中的该编号,使用从图像中获得的支付金额更新员工。员工编号和支付金额都写在图像上指定位置的两个方框内。
有没有办法自动化这个。基本上我想用.net中的.net解决方案。我知道这可以使用人工神经网络来完成。
非常感谢任何想法。
答案 0 :(得分:3)
您可以使用Office 2003/2007中包含的Microsoft Office Document Imaging Library(MODI)。
链接:
答案 1 :(得分:1)
模式识别是研究神经网络时的一个基本例子。我不知道是否有任何库/框架在C#中使用AI。如果你找到一个,首先你需要做的是训练网络(监督学习),为此你需要准备一个大的样本集图像;更多示例 - >结果更准确。另一方面,您可以使用OpenCV(C / C ++,Python和Java),这是一个专门从事计算机视觉的库,并且有一个实现AI方法的模块。
祝你有愉快的一天! 奥斯卡。
答案 2 :(得分:1)
我认为这很难实现自动化。问题只是因为你需要某种非常好的OCR软件。即使你得到了这个,如果它读错了什么,导致某人的手写错误呢?如果身份证错了,则付款被记录给错误的员工,如果金额错误,他的工资就会错误!
两者都是你不会真正发生的事情。只是为了向您展示一个好的ocr有多难找到,只需看看captcha如何工作。原则只不过是难以阅读的文字形象。
所以我的意见是,你无法真正实现这一过程的自动化。至少你可以通过手动输入值来编写一个程序来帮助人类(也可以看一下Amazon Mechanical Turk):
为了使这个过程快速流畅,您必须非常谨慎地使用键盘来轻松输入值:
通过使用这样的流程,一个人可以在数据库中输入许多条目,并且成本比之后在数据库中查找错误条目便宜得多。
最后一个建议:
因为这对于人类来说是一个无聊的过程,很容易导致错误,也许让两个人输入这些值,并且只有两者都输入相同而不是将此值视为已批准。这应该导致99%以上的正确率。如果您需要绝对100%考虑让4-5人检查一个条目,并且只有当所有条目都输入相同的值时才将其视为已批准。为了得到关于你的ocr软件有多好的比较,只需让它运行你的图像并将这些结果与人类输入的值进行比较,以获得一个想法,当你真的只能依靠你的ocr时。
答案 3 :(得分:1)
OCR引擎未接受过阅读手写文本的培训,因此您可能无法使用MODI。你想尝试找一个ICR引擎。即便如此,其中最好的只有80%的准确输入。你可能会变得更好,因为你知道你的文字总是数字。
这个问题/答案说OCROpus有ICR
答案 4 :(得分:1)
有针对OCR / ICR的LeadTools SDK。这在识别手写字符方面非常方便。我正在做这个可行的研究,直到现在我认为它会成功。 leadTools提供了可在您的应用程序中使用的组件,它支持C,C ++,C#,VB.Net等。
您可以访问以下链接: http://www.leadtools.com/downloads/default.htm?category=