OCR用于从cedula /护照C#中提取文本

时间:2016-08-17 05:57:12

标签: c# asp.net-mvc image-processing ocr

我正在寻找Tesseract或Google的Vision API类型的OCR,这有助于提取护照/身份证图片中的文字信息,(可以从移动设备捕获或者可以扫描。因此帧大小可能会有所不同)。我经历了几个帖子,并发现Tesseract是首选解决方案。

我还使用Vision API测试了我的测试数据,并且 99%获得了准确且满意的结果。但我有以下问题/要求:

问题

  • Tesseract是我在大多数帖子中找到的建议解决方案,但它给出了非常糟糕的结果,因为框架可能会有所不同。我无法训练数据,我可以使用任何付费库来帮助我完成我的工作。
  • Vision API提供准确的结果,但我的要求是使用基于云的解决方案。
  • 提供此功能的提供商很少,(例如,LeadToolIdScan等。),但他们首先使用扫描仪扫描护照。因此,他们的SDK适用于他们的扫描仪设备。

摘要:是否有可用的(付费或开源) c#库,它将护照/ cedula图像作为输入,并返回准确的文本? 。任何建议/帮助将不胜感激。

4 个答案:

答案 0 :(得分:3)

公司名为MicroBlink创建了BlinkID SDK来扫描护照,身份证。它不是免费的商业用途,但免费开发。链接到SDK的网站HERE。 Tesseract OCR工具可能会给您错误的结果,因为您可能在OCR扫描之前没有对图像进行任何处理,如果您想要正确的结果,这是必需的,特别是对于护照和ID等的图像。对于图像处理,您可以使用OpenCV(免费),但可能需要时间来学习计算机视觉和图像处理(实际上非​​常有价值)。

答案 1 :(得分:1)

Asprise C# .NET OCR and Barcode Recognition SDK可识别护照和其他身份证件上的正常文本,MRZ数据和条形码。 MRZ数据的准确率非常高。

您只需传输BMP,JPG,PNG,PDF或TIFF等格式的输入图像。

许多政府机构使用Asprise OCR to read passport MRZ信息。

您可以联系Asprise support以获取针对您的方案的特殊评估版本。

答案 2 :(得分:1)

我是MicroBlink的开发人员之一,这是一家专门开发条形码和OCR解决方案的公司。

Tesseract确实是您的选择之一。 Tesseract的问题在于,设置正确的参数以获得非常准确的OCR结果很困难。而且您仍需要在OCR结果之上实现数据提取逻辑。 iOS / Android上的集成需要两个独立的代码库。

Google Cloud Vision提供了非常准确的OCR结果,但正如您所说,它在服务器端执行图像处理,这会引起隐私和安全问题,即通过网络向第三方发送私人ID信息。

还有其他公司正在开发具有类似属性的类似产品(服务器端,无数据提取等)。

MicroBlink的BlinkID在本地执行所有处理(没有服务器端连接)的意义上是不同的。它使用我们专有的基于机器学习的OCR引擎来确保正确捕获数据。它支持MRZ,PDF417条形码,并扫描一些身份证件的正面(例如英国驾驶执照,马来西亚身份证,欧盟身份证......)。所有ID数据都根据国家/地区的标准进行解析和验证,并使用校验和验证。

BlinkID作为原生iOS,Android和Windows Phone 8 SDK,适用于iOS和Android的Phonegap / Cordova插件以及适用于iOS和Android的Xamarin组件(C#)提供。

还有服务器端库(可根据要求提供),它可以在Linux / Windows / MacOS上运行,并且具有C API,可以使用C ++ / CLI从.NET应用程序中使用。我们的开发团队可以帮助您在.NET应用程序中进行集成。

有关此主题的更多信息,请联系support@microblink.com。

答案 3 :(得分:0)

只是对LEADTOOLS需要修正......

  

“首先使用他们的扫描仪扫描护照。因此他们的SDK   适用于他们的扫描仪设备“

这部分不正确。我们不制造或销售任何类型的扫描设备。 LEADTOOLS SDK可以使用不同的标准设备(Windows上的Twain和WIA,Linux上的Sane以及使用操作系统自己的API的Android和iOS设备上的摄像头)。然后通过软件完成OCR和ID识别。