我有一个问题,我拥有大量扫描图像的图像数据(有序梯度的直方图)。每个图像可以包含数字和手写标记。我希望能够拍摄每个图像并返回存在的数字/标记。由于存在固定数量的可能数字/标记(总计18个),因此我将每个数字/标记都视为标签,并且我计划将其作为多标签分类问题来解决。但是,另外的复杂之处在于标签的顺序很重要。我需要能够将43的图像与34的图像区分开。
因此每个标签取一个整数值:如果不在图像中,则为0;如果在第一个位置,则为1;如果在第二个位置,则为2,依此类推。对于其他情况,95%的样本仅包含1个标签,单个图像中的最大标签数为3。
您是否有解决此问题的最佳方法的想法?我当时想尝试将其表述为排名问题,但我还没有碰到多少运气。谢谢!