所以基本上一个人在训练/测试中拆分数据库。让我们说2/3训练,剩下的就是测试。
然后在caffe中我们将不同大小的训练数据分开,让我们说我们每组有100批50张图像,所以我们有5000张训练图像。现在让我们说我们有50个测试批次,每个50个图像。
现在让'说caffe做了1个纪元,然后用测试批次进行测试。 caffe如何做到这一点?
它需要第一次培训批次,并且它会尝试预测每个测试批次的标签吗?
像:
{{1}}
然后它提取training_batch_1的平均准确度。然后用training_batch_2做同样的事情,依此类推?
答案 0 :(得分:0)
测试只是通过训练模型的单个前向传递来运行输入向量。顶部预测标签是否与给定的测试值匹配?如果是这样,得1分。在批次结束时,按批次大小划分总点数,以及批次准确度。
在测试运行结束时,采用批次精度的平均值;这是测试的准确性。
那是你需要知道的吗?