我想从账单图像中提取有用的信息。
我已经使用OCR + pytesseract将图像转换为文本,并根据总数,金额等特定字词提取信息。
处理各种类型的非结构化账单以提取账单和金额的最佳通用方法是什么?
答案 0 :(得分:0)
如果是非结构化,旋转,翻译,光变异图像识别,最好选择深度学习模型。
最初使用包含不同类型变体的n个图像训练您的网络。
Ex让我们说我们需要找到“金额”这个词的位置:
图片1:在右上角放置“金额”一词的账单图像
图像2:在左上角放置“金额”一词的帐单图像
...
这些将是您的输入培训样本。您的输出将是“金额”一词的位置坐标。
您可以查看this链接,详细了解如何创建深度学习模型。
答案 1 :(得分:0)
您可以尝试使用正则表达式来匹配金额,然后对于每个金额匹配,您应该从同一行提取前一个单词 - 这应该为您提供产品说明。
请注意,此过程仅适用于与样本图像具有相同结构的帐单。另请注意,准确度取决于OCR的准确性。
要提高OCR准确度,您应该尝试增强图像或使用一些商业OCR引擎,以便在图像质量较差的情况下提供更好的文本质量。
还有现成的产品可以像您这样的账单图像执行OCR和产品提取。这种产品的一个例子是BlinkReceipt。
免责声明:我为一家创建BlinkReceipt的公司工作。