标签: machine-learning
我相信,对于训练集中的一个示例,成本函数会汇总所有输出的输出误差。原则上,这笔费用如何计算?
在反向传播之前,成本是向每个示例传播回去还是在训练集中的所有示例(或其子集)中平均化?
如果对成本进行平均,是为每个输出存储平均值,还是对所有成本进行平均,以便从每个输出神经元传播回总成本?