我找到了这个令人敬畏的开源图像识别框架 - Pastec,它以我拍摄物体视频的方式运行得非常好,并对10%的视频帧进行采样,它可以识别出来其余的视频很好。
然而,在我将视频编入索引并在完全不同的环境中拍摄另一张照片之后,即使对我来说它们看起来非常相似也无法识别它。
我需要在特征提取和索引之前应用一些基本处理,如阈值处理(二进制),平滑处理和轮廓处理吗?另外,如果是这种情况,我可能还需要在查询之前应用相同的技术。
这里我正在拍摄几乎360度的产品视频并索引数据库中的所有帧,希望搜索到的图片将是训练数据中出现的角度。
在项目中,它提到“没有设计用于识别面部,3D物体,条形码或QR码。”,我不知道我是否在这里浪费时间使用此软件或是否有任何其他方法/工具/我需要采用的技巧。
答案 0 :(得分:0)
Pastec基于Visual Words,后者又使用SIFT或SURF等本地描述符。这两个不是完全旋转不变的,如果观点不同,很可能完全失败。
照明的差异显然会对识别能力产生巨大影响。不幸的是,预处理可能会有所帮助,但不是很多。我会个人使用统计或神经网络方法来解决这个问题。