从购物账单中提取总价

时间:2016-12-19 03:15:55

标签: algorithm ocr tesseract image-recognition

我正在开发一个应用程序,我需要从其图片中获取任何购物账单中显示的净价。我已经使用“tesseract ocr”API从账单图像中检索了可编辑的文本。现在我只需要从文本中打印“总计金额”。如何从具有项目名称,数量和价格的整个账单中仅提取该部分(总价)?

1 个答案:

答案 0 :(得分:0)

简短的回答,我不认为有一种快速/方便的方法可以直接打电话。

您需要查看从.hocr返回的Tesseract文件(您可以先获取google hocr以获取更多信息)。 .hocr包含文本的所有边界框({​​{1}}等),然后使用这些值,您可以确定单词是否在同一行(单词' Total&#39 ;总量很可能印在同一条线上。)

从这里你可以列出单词,添加一些逻辑操作(可能删除所有字符/单词),然后你就可以获得总价值。

ps:我的公司正在研究类似的东西,但我们决定不使用Tesseract,因为它有点慢而且不容易训练(我们用几种语言处理收据)。我们正在使用Google Vision API。

希望我的回答有所帮助:D