我有一个目录,其中包含许多由网络摄像头捕获的不同面部图像。 每个人的脸部被捕获10-20次并持续一段时间(例如:personA图像:img_01,img02,img19,img20; personB图像:img_03,img13,img14等)
我想对每个人的所有图像进行聚类,并将它们组合为一个,这样我就可以与人数一样多的聚类。(例如:如果有10个人脸和50个图像在目录中然后我应该得到10个簇或计为10)。我可以使用什么方法对同一个人的图像进行分组。我正在研究Python。请帮助我。
这就是我的文件夹的样子 - >点击1查看屏幕截图1
答案 0 :(得分:0)
您可以使用名为 k-means 的技术。这将采用数据集并将其聚类到$ k $不同的集群中。如果您知道有10个人,则可以将$ k $设置为10。
但是,您需要考虑图像的尺寸非常高。您需要找到一种通过特征提取来减少此集合的方法。这可以通过几种不同的方式完成。如果您正在使用openCV,那么您可以直接获取人鼻子和眼睛的距离,以及所有这些。这些可以是良好的标识符指标。否则,我建议您构建一种自动编码器,然后使用压缩集作为k-means算法的特征。
OpenCV具有许多功能,可以完成一整套面部检测功能。我建议使用this tutorial中提供的以下技巧。这将检测鼻子,眼睛和脸部的形状。从这些点,您可以计算一些指标。我建议使用几种不同的比率
您可以继续发挥创意并获得更多指标。
然后,您将构建一个数据集,其中行是每个单独的图片。然后每列将代表一个功能。这将是您使用图像计算的这些比率。
然后你可以使用k-means的sklearn包,它有一个示例代码here。