关于用于字符识别的card.io模型的澄清

时间:2015-02-25 11:15:27

标签: card.io

我开始将card.io视为Android应用程序的一部分,该应用程序应该能够扫描卡并识别卡号,到期日期,持卡人。

在挖了一段时间之后,我到了card.io-dmz / models / generated文件夹,在那里我看到文件,根据他们开头的评论,"从models / conv /中自动生成。 "

但是我无法找到有关用于生成这些"模型"的文件的详细信息。在检查代码之后,我假设这些生成的文件直接负责卡中数字的OCR。

举一个例子,扫描并识别以下卡片(仅限数字)

Embossed card

但以下卡失败

Non embossed card

我尝试在完成垂直分割之前调整ROI,但我认为2张卡上使用的字体之间的差异使得无法扫描第二张卡。

我的问题是,鉴于目前来自git hub的开源项目,是否有人有机会添加类似上面的黑色扫描卡的功能,或者这需要访问其他资源用于执行实际的OCR?

1 个答案:

答案 0 :(得分:1)

来自card.io的戴夫。

@Adrian你的结论都是正确的。

虽然我们希望扩展我们的deep-learning字符识别模型以涵盖更新的样式卡,例如上面的第二张卡,但这是一项艰巨的任务。

首先要更新定位卡号的代码,然后培训新的字符识别模型,需要相当多的新式卡(~100)。

目前,这并不适合开源。由于某种原因,人们往往不想分享他们的信用卡图像。

我们已经考虑过创建一个开源应用程序,可用于收集卡片图像的某些部分(例如,所有数字位置,以及只有几个数字的实际图像,加上到期日的图像)。那么也许我们可以挤出一个有用的大量信息。在构建该系列的同时,我们可以开源我们为计算机视觉和深度学习而创建的许多内部工具。

这样的项目是否可以参与?