检测目录页面中的商品(图片,价格和描述)

时间:2018-06-12 22:57:02

标签: opencv image-processing computer-vision

我想检测商品目录中页面上的商品。

示例页面: 1 2 一个优惠包括价格,描述和图像。我已经在每个页面上标记了一个红色方块。

我是否在脑子里?

非常感谢任何建议,

谢谢!

1 个答案:

答案 0 :(得分:2)

这个问题需要大量使用不同技术的工作。我将尝试编写一个您可以选择遵循的基本分步过程。我想指出,这不会返回非常高的准确度,而是取决于每个组件的准确程度。

  1. 从图像中提取轮廓:Opencv有一个关于轮廓的简单教程。尝试为形态变换找到正确的迭代次数,以便图像和旁边的文本成为一个轮廓
  2. 使用OCR从这些轮廓中提取文本:Tesseract OCR可能是您拥有的最佳选择。您可能需要将图像转换为二进制或灰度作为预处理步骤,以改善结果。
  3. 创建一个语料库,确定哪个文本对应于折扣:像python列表那样简单的东西应该这样做。列出表明促销优惠/折扣的关键词。将您的OCR结果映射到此语料库,以确定文本是否在讨论要约。
  4. 对不起,我无法在图片中的描述旁边找到小标识。如果任何小邮票/徽标对应折扣,您也会尝试使用模板匹配技术。