由于重新识别最多只能从搜索脸部操作中返回4096个结果,因此,当一个源脸部可以与另一个源脸部相关联并且目标脸部可以在其中显示时,如何使源脸部和目标脸部的性能尽可能地匹配多个源面的结果?
最后,我们希望将所有相似的源面组合在一起,并确保每个目标面都链接到正确的源面组。
我遍历了每个索引的面部(约80,000个),并创建了一个表结构,该结构显示了源面部ID和目标面部ID之间的相似性。
INSERT INTO `items_faces_compare` (`id`, `source_item_face_id`, `target_item_face_id`,`similarity`)
VALUES
(1, 1, 2, 95),
(2, 1, 3, 85),
(3, 1, 4, 94),
(4, 5, 3, 96),
(5, 6, 3, 90),
(6, 7, 3, 86),
我希望以下匹配项:
Source ID 5: [3]
Source ID 6: [3]
Source ID 7: []
然后我想进一步匹配源ID 5和6
用于比较面孔表的数据集是来自约40,000张图像和约80K张面孔的250万行。分组数据最有效的方法是什么?