应用错误收集

我想使用Google Vision从支持以下格式的id文档中自动提取信息：

格式1：

我应该有能力：

格式2：

尽管API的文本识别非常准确，但我在理解提取的信息方面还是有困难。

JSON响应以格式1 聚合不同块中的文本，以实例化BLOCK 1（ESPAÑA）BLOCK 2（DOCUMENTO NACIONAL DE IDENTIDAD）。

问题在于这些块似乎是任意的，有时它返回不同的块，或者以不同的方式聚集它们。

1）您会提出什么建议来自动化此过程？

2）您可以显示一个在类似情况下处理响应的示例吗？

3）是否有一种方法可以训练平台根据我们要提取的内容来汇总信息？