训练模型从包含文本的图像中定位并提取街道地址

时间:2019-05-30 12:29:50

标签: python image-processing machine-learning conv-neural-network

我正在尝试解决一个需要从名片,日历等图像中提取印度街道地址的问题。我希望使用某种形式的CNN或{{1 }}。用户将移动摄像机悬停在图像上(例如名片),模型应该能够从图像中提取街道地址。 请注意,图像可能还包含许多其他信息。提取也应以扫描QR码的方式进行。用户无需触摸捕获按钮或类似的按钮。

通过Google搜索相同的内容,我进入了RNNAddressNet。我尝试了OCR,但它也提取了其他不相关的信息。 OCR解决了另一个问题。它试图在文本中找到街道名称,号码,门牌号,省等。我可能还没有意识到AddressNet的不同用法。

预期输出是一个字符串,表示模型提取的街道地址。

0 个答案:

没有答案