因此,我正在尝试在Android中实现一个个人项目,您可以在其中扫描购物中心的不同收据。我想提出一个模块,该模块可以通过自动执行尽可能多的活动来帮助用户进行一些手动输入。情况是:
我想取回收据的总金额,因为它知道可以作为标准在以下行中找到:TOTAL ........... 33.9货币。如何实际获得与包含“总计”的块在同一轴上的块?
对于每个单独的产品都适用相同的条件,我想获取每个单独的购物车产品的值及其值,然后将其放入Android的“编辑文本”中,以便用户进行最终修饰。
收据示例:
答案 0 :(得分:0)
这看起来像是项目构想,而不是编码问题。
我建议的一件事是从边界框的相对位置猜测这些块。
这是一个具有挑战性的研究问题。也许Vision API会为客户打开一些功能以直接了解收据。
答案 1 :(得分:0)
要逐行获取文本,您需要设置一个自定义逻辑,该逻辑将根据Google Vision API返回的符号来处理行,该过程可以遵循以下步骤:
TextAnnotation
中返回的所有符号的集合string
与其他所有符号X坐标)来创建一行givenSymbol.BoundingBox.Vertices[2].X
。