我将使用Firebase ML Text Recognition API开发收据识别系统。 我想从收据图像中提取文本,并分别为每个字段存储信息。
例如。 收货时,会提供购买物品清单,价格,零售商信息等信息。 我想分别获取“购买商品”,“价格”,“零售商信息”的信息。 从捕获的图像中提取文本是使用Firebase ML文本识别API完成的,但在将信息字段与收据图像分开时仍然遇到问题。
我已经看到了使用python正则表达式的方式,但是这种方式与我正在处理的收据不匹配。
有什么方法可以将信息与识别的文本分开吗?
谢谢!