这个问题需要大量使用不同技术的工作。我将尝试编写一个您可以选择遵循的基本分步过程。我想指出,这不会返回非常高的准确度,而是取决于每个组件的准确程度。
- 从图像中提取轮廓:Opencv有一个关于轮廓的简单教程。尝试为形态变换找到正确的迭代次数,以便图像和旁边的文本成为一个轮廓
- 使用OCR从这些轮廓中提取文本:Tesseract OCR可能是您拥有的最佳选择。您可能需要将图像转换为二进制或灰度作为预处理步骤,以改善结果。
- 创建一个语料库,确定哪个文本对应于折扣:像python列表那样简单的东西应该这样做。列出表明促销优惠/折扣的关键词。将您的OCR结果映射到此语料库,以确定文本是否在讨论要约。
醇>
对不起,我无法在图片中的描述旁边找到小标识。如果任何小邮票/徽标对应折扣,您也会尝试使用模板匹配技术。