我目前正在制作具有1个类的自定义数据集。我标记的图像在每个图像中都包含多个这些对象(介于30-70之间)。因此,我想知道在评估数据集的大小时是否应该将每个图像中的每个对象都算作“ 1个数据点”?
即:每个图像中是否有更多对象需要更少的图像?
答案 0 :(得分:1)
由于这是一个检测问题,因此数据集的大小由图像数量和对象数量共同给出。没有理由选择两者之一,因为它们都是同等重要的数字。
如果您确实要定义“大小”,则可能必须从错误指标开始。通常用于对象检测的是mIoU(联合上的平均交集)。该指标是对象级别的指标,因此无论您拥有10幅图像还是1百万图像,它都不会在意。
最后,每个图像可能包含许多对象,这使您可以使用较少的图像总数,但这只能通过实验来确认。