我想使用Google Vision从支持以下格式的id文档中自动提取信息:
格式1:
我应该有能力:
格式2:
尽管API的文本识别非常准确,但我在理解提取的信息方面还是有困难。
JSON响应以格式1 聚合不同块中的文本,以实例化BLOCK 1(ESPAÑA)BLOCK 2(DOCUMENTO NACIONAL DE IDENTIDAD)。
问题在于这些块似乎是任意的,有时它返回不同的块,或者以不同的方式聚集它们。
1)您会提出什么建议来自动化此过程?
2)您可以显示一个在类似情况下处理响应的示例吗?
3)是否有一种方法可以训练平台根据我们要提取的内容来汇总信息?