在机器学习中,我们知道在准备好部署模型时,应该使用测试数据设置。在此之前,我们使用训练数据集合训练模型,并将其分为 train 和 validation 或交叉验证方法。在这里,每组都有相应的标签。
因此,通过从模型进行预测来评估或找到混淆矩阵非常简单。我们首先可以预测y_pred
并将其与y_val
进行比较。在这种情况下,如何获取没有标签的测试集的准确性或衡量其性能。而且我知道,它不应该设置标签。
但是,如何测量此测试集的性能?还是仅通过使用训练集来确保模型的性能?听起来像是一个愚蠢的问题,但是对我的快速建议或纠正非常赞赏。谢谢。
答案 0 :(得分:1)
您不能。基本上,您有两个选择:手动标记测试数据(可能只是一部分),或者信任训练准确性,并可能将其降低10%。我建议第一种方法。