我使用AutoML Vision BETA。评估页面显示混淆矩阵,如下所示:
A B C
A 93.5% 4.1% 2.4%
B 4.5% 94.1% 1.4%
C 1.1% 4.3% 94.7%
我导出了数据,并使用TEST数据集中的所有图像调用了预测API。结果与EVALUATE页面不同:
A B C
A 92.9% 4.7% 2.4%
B 4.1% 94.6% 1.4%
C 1.1% 4.3% 94.7%
我将最高分的标签视为预测标签。 EVALUATE页面中的混淆矩阵的行为是否相同?