我一直在将ResNeXt50权重从Pytorch转换为Tensorflow。我似乎已经从卷积层和完全连接的磁头转移了所有其他权重,但是,我似乎无法在批次归一化层内部正确转移值。据我了解,Pytorch批处理规范化层具有weight
,bias
,running_mean
和running_var
。它们对应于Tensorflow批处理规范化中的gamma
,beta
,moving_mean
和moving_variance
。当我将其转换为Tensorflow时,我已经检查了批处理规范化层的权重,看来一切正常。但是,当我进行预测时,Tensorflow批处理规范化的输出值与Pytorch批处理规范化的输出值相去甚远。这是因为转换错误,还是两个库在推断时的批处理规范化行为不同?