我正在开展一个项目,可以使用OCR读取收据并解析收据,以获取商家名称,日期,金额等重要信息。我正在使用谷歌提供的vision API来解析一个图像,并以JSON格式从中获取文本。现在我想进入下一步,我可以解析文本,并尝试通过它的位置或表达来识别信息。现在我能够从简单货币后跟数字字符串中提取金额。从这一点开始,我应该在哪里寻找分析文本以提取任何信息(尝试开发一个可以从任何类型的收据中提取信息的系统)。即使是一个小小的领导也会帮助我前进。
感谢。
答案 0 :(得分:0)
我开始从返回的文本格式中提取信息,方法是查找" Date" ,"金额" ,"总计" ," Rs"。我开发了一种算法,将不同的数字排列为实际数量。此外,我获取了商家名称,在大多数情况下,通过删除代币("","","欢迎")等。