应用错误收集

检测目录页面中的商品（图片，价格和描述）

时间：2018-06-12 22:57:02

标签： opencv image-processing computer-vision

我想检测商品目录中页面上的商品。

示例页面：一个优惠包括价格，描述和图像。我已经在每个页面上标记了一个红色方块。

我是否在脑子里？

非常感谢任何建议，

谢谢！

1 个答案:

答案 0 :(得分：2)

这个问题需要大量使用不同技术的工作。我将尝试编写一个您可以选择遵循的基本分步过程。我想指出，这不会返回非常高的准确度，而是取决于每个组件的准确程度。

从图像中提取轮廓：Opencv有一个关于轮廓的简单教程。尝试为形态变换找到正确的迭代次数，以便图像和旁边的文本成为一个轮廓
使用OCR从这些轮廓中提取文本：Tesseract OCR可能是您拥有的最佳选择。您可能需要将图像转换为二进制或灰度作为预处理步骤，以改善结果。
创建一个语料库，确定哪个文本对应于折扣：像python列表那样简单的东西应该这样做。列出表明促销优惠/折扣的关键词。将您的OCR结果映射到此语料库，以确定文本是否在讨论要约。

对不起，我无法在图片中的描述旁边找到小标识。如果任何小邮票/徽标对应折扣，您也会尝试使用模板匹配技术。