使用C#将扫描的文档读取到数据库字段

时间:2010-10-20 11:45:40

标签: .net

我是C#的新开发人员。我在开发一些应用程序时遇到了问题。

我必须开发一个“应用程序”,打开扫描文档(任何申请表或银行支票)和将所需的文件数据保存到数据库,例如... 检查号码,扫描的支票副本中的帐号号或学校申请表中的学生姓名,卷号等。

我有关于使用像素的想法。

请提供有关它的解决方案。

我正在使用带有C#语言的.Net Framework 3.5

关心 Varun Dutta

2 个答案:

答案 0 :(得分:2)

要将文档保存到数据库,有两种思路。

  1. 将文件另存为行中的blob
  2. 将文件放在客户端可以访问的服务器文件系统上,并将文件名放在数据库中
  3. 我写了一些博客文章,详细介绍了每种方法的优缺点:

    http://www.atalasoft.com/cs/blogs/loufranco/archive/2007/12/03/images-in-databases-part-i-what-to-store.aspx

    http://www.atalasoft.com/cs/blogs/loufranco/archive/2007/12/04/images-in-databases-part-ii-web-images-are-random-access.aspx

    http://www.atalasoft.com/cs/blogs/loufranco/archive/2009/04/28/document-storage-database-blobs-or-the-filesystem.aspx

    它归结为便利(blob)与性能(文件系统) - 文件越大,您更喜欢使用文件系统。如果您使用的是当前版本的SQL Server,那么有一个文件系统字段类型,您将为您提供方便 - 因此这是两个世界中最好的,但不是标准的。

    至于从图像中获取信息,您需要OCR。最好的开源OCR是来自Google的Tesseract。

    如果您想查看商业选项,我的公司Atalasoft会销售OCR引擎,我们有.NET wrapper of Tesseract

答案 1 :(得分:1)

您希望使用OCR从图片中检索数据,Office中有一个OCR组件,您可以使用本文中所示的组件:Using The Office 2007 OCR Component in C#

否则,有一个问题要求图书馆执行此操作:Any open source C# OCR library?

在检索完数据之后,只需使用符合您要求的任何类(SqlConnection或类似数据)将其插入数据库。