我是C#的新开发人员。我在开发一些应用程序时遇到了问题。
我必须开发一个“应用程序”,打开扫描文档(任何申请表或银行支票)和将所需的文件数据保存到数据库,例如... 检查号码,扫描的支票副本中的帐号号或学校申请表中的学生姓名,卷号等。
我有关于使用像素的想法。
请提供有关它的解决方案。
我正在使用带有C#语言的.Net Framework 3.5
关心 Varun Dutta
答案 0 :(得分:2)
要将文档保存到数据库,有两种思路。
我写了一些博客文章,详细介绍了每种方法的优缺点:
它归结为便利(blob)与性能(文件系统) - 文件越大,您更喜欢使用文件系统。如果您使用的是当前版本的SQL Server,那么有一个文件系统字段类型,您将为您提供方便 - 因此这是两个世界中最好的,但不是标准的。
至于从图像中获取信息,您需要OCR。最好的开源OCR是来自Google的Tesseract。
如果您想查看商业选项,我的公司Atalasoft会销售OCR引擎,我们有.NET wrapper of Tesseract。
答案 1 :(得分:1)
您希望使用OCR从图片中检索数据,Office中有一个OCR组件,您可以使用本文中所示的组件:Using The Office 2007 OCR Component in C#
否则,有一个问题要求图书馆执行此操作:Any open source C# OCR library?
在检索完数据之后,只需使用符合您要求的任何类(SqlConnection或类似数据)将其插入数据库。