OCR在iPhone应用程序中的名片阅读器

时间:2011-11-09 19:10:19

标签: iphone objective-c ocr

我使用开源库“tesseract”在我的iPhone应用程序中整合了OCR。我在AppStore上看到了一些应用程序。我只是想知道如何隔离它从卡上读取的数据,即如何区分说出FirstName和LastName,或者在CompanyName和人名之间,我将如何区分数字是电话号码还是传真号码#etc。

我希望有一些标准格式的名片,但我觉得这样做很难运气。任何对此的暗示都会有所帮助。

我在这里发布了它,以收集各种开发人员的想法,以便我能够提出一些好的逻辑(使其更准确)来分类我们从OCR引擎获得的数据。

2 个答案:

答案 0 :(得分:2)

  • 创建一些猜测,如何解释各种文本片段,让用户选择最好的文本片段。格式应该是每个国家的标准(例如英文/德文/法文等,名字前面的名字是99.9%)
  • 如果现在猜测足够好,用户可以自己分配字段
  • 对于firstname / lastname问题,您可以在用户所在的国家/地区查询具有常见预解析名称的本地文件或Web服务

答案 1 :(得分:0)

为了区分名字,姓氏,公司名称,传真或电话号码,请使用“正则表达式”。

示例:

电话-“ ^(\ s * \ d \ s *){12} $”
电子邮件-“ ^ \ w + @ [a-zA-Z _] + ?. [a-zA-Z] {2,3} $”

以同样的方式,您可以在下面的链接中找到其他Label的正则表达式。

https://www.geeksforgeeks.org/write-regular-expressions/

谢谢。