我正在研究一种使用opencv或深度学习从读取图像内容(即该人的穿着)来检测具有特定ID(在呼叫应用程序数据库上)的人的方法。
假设您有一个呼叫应用程序,该应用程序包含一个定期访问商店的注册人员数据库。假设这些人佩戴的徽标带有唯一的视觉标识符(例如条形码,而不是条形码),并且我们的系统希望将其与系统上的关联ID相匹配。
想到的直接解决方案是训练CNN寻找该唯一标识符-如果您必须对10个人甚至20个人进行分类,这很好,但是如果您有100多个具有独特视觉提示的人,那该怎么办。显然,在每个图像上训练网络都无法扩展。
我想知道是否有一个无需深度学习的opencv实现,因为这会使运行时更快
答案 0 :(得分:0)
此问题是重新标识。一种方法-暹罗网络。他们经过训练可以在多维空间中生成矢量,这些矢量对于不同的对象彼此远离,而对于相似的对象则彼此靠近。 您可以看到decision from OpenVINO。
答案 1 :(得分:0)
您实际上不需要对此进行深度学习,您所拥有的很明显,您将在图像中具有功能,并且需要跟踪视频中的功能。
检查功能检测器,其中一些很好:
如果您查看此图片: 您看到我们可以将书的图像与任何图像匹配,因此我们最终可以对其进行跟踪(这是通过SLAM(同步本地化和映射)或SFM(运动结构)完成的)
由于您关心解决方案的扩展,因此生成功能将是困难的部分,在某些ARUCO库中做得很好的库中,您可以创建易于区分和检测的标签字典:< / p>
还有April Tags,Alvar标签等,每个标签都有其自身的优缺点(特征检测器具有不同的许可模型)。 您还可以创建自己的标记或功能来检测。
我希望这是一个很好的起点!
答案 2 :(得分:-1)
也许template matching可能很适合吗?