在Caffe训练时,每次迭代都有训练和测试净输出。我知道这是损失。但是,这是我的批次或总损失的平均损失吗?分类和回归这两个是一样的吗?
例如,如果我有一批100个训练样例并且我对该迭代的损失是100,那是否意味着每个例子的平均损失是1?
答案 0 :(得分:2)
火车损失是上一次培训批次的平均损失。这意味着,如果您的小批量中有100个训练样例,并且您对该迭代的损失为100,那么每个示例的平均损失等于100。
测试损失也是平均损失,但超过所有测试批次。您可以指定测试批次大小和测试迭代次数。 Caffe将采用这些小批量的#iter,评估它们的损失并为您提供平均值。如果#test_iter x batch_size == testset_size
,您将在整个测试集中获得平均值。