我正在尝试解决一个需要从名片,日历等图像中提取印度街道地址的问题。我希望使用某种形式的CNN
或{{1 }}。用户将移动摄像机悬停在图像上(例如名片),模型应该能够从图像中提取街道地址。
请注意,图像可能还包含许多其他信息。提取也应以扫描QR码的方式进行。用户无需触摸捕获按钮或类似的按钮。
通过Google搜索相同的内容,我进入了RNN
,AddressNet
。我尝试了OCR
,但它也提取了其他不相关的信息。 OCR
解决了另一个问题。它试图在文本中找到街道名称,号码,门牌号,省等。我可能还没有意识到AddressNet
的不同用法。
预期输出是一个字符串,表示模型提取的街道地址。