我正在开发一个应用程序,我需要从其图片中获取任何购物账单中显示的净价。我已经使用“tesseract ocr”API从账单图像中检索了可编辑的文本。现在我只需要从文本中打印“总计金额”。如何从具有项目名称,数量和价格的整个账单中仅提取该部分(总价)?
答案 0 :(得分:0)
简短的回答,我不认为有一种快速/方便的方法可以直接打电话。
您需要查看从.hocr
返回的Tesseract
文件(您可以先获取google hocr以获取更多信息)。 .hocr
包含文本的所有边界框({{1}}等),然后使用这些值,您可以确定单词是否在同一行(单词' Total&#39 ;总量很可能印在同一条线上。)
从这里你可以列出单词,添加一些逻辑操作(可能删除所有字符/单词),然后你就可以获得总价值。
ps:我的公司正在研究类似的东西,但我们决定不使用Tesseract,因为它有点慢而且不容易训练(我们用几种语言处理收据)。我们正在使用Google Vision API。希望我的回答有所帮助:D