我有大约1000个存储库,每个存储库包含不同数量的图像,我使用20个模板,然后为所有存储库构建模型,以便:
每个存储库包含N个图像(N与其他图像不同)然后对于每个图像,它与预定义的模板(20个模板)进行比较,如果找到则为1,否则为0,一些图像我包含两个以上的模板,如图1所示 NBA日志可以在百事可乐日志中找到,对其他人来说也是如此。
我的问题什么是模型可以用来根据预定义的类集对这些存储库进行分类,同时考虑到我的值是二进制的,每个存储库包含不同数量的图像?
Template-dataset
repo-ID image-id NBA Pepsi Cisco-logo .. Spy-cam class
Rep1 image1 1 1 0 0 A
Rep1 image2 0 0 0 0 N
.... ...... 0 0 0 1 B
Rep2 image1 0 1 0 0 C