我使用开源库“tesseract”在我的iPhone应用程序中整合了OCR。我在AppStore上看到了一些应用程序。我只是想知道如何隔离它从卡上读取的数据,即如何区分说出FirstName和LastName,或者在CompanyName和人名之间,我将如何区分数字是电话号码还是传真号码#etc。
我希望有一些标准格式的名片,但我觉得这样做很难运气。任何对此的暗示都会有所帮助。
我在这里发布了它,以收集各种开发人员的想法,以便我能够提出一些好的逻辑(使其更准确)来分类我们从OCR引擎获得的数据。
答案 0 :(得分:2)
答案 1 :(得分:0)
为了区分名字,姓氏,公司名称,传真或电话号码,请使用“正则表达式”。
示例:
电话-“ ^(\ s * \ d \ s *){12} $”
电子邮件-“ ^ \ w + @ [a-zA-Z _] + ?. [a-zA-Z] {2,3} $”
以同样的方式,您可以在下面的链接中找到其他Label的正则表达式。
https://www.geeksforgeeks.org/write-regular-expressions/
谢谢。