为了理解BatchNorm1d
在PyTorch中是如何工作的,我尝试在2D张量上匹配BatchNorm1d
操作的输出并手动将其标准化。手动输出似乎缩小了0.9747倍。这是代码(请注意,仿射设置为false):
import torch
import torch.nn as nn
from torch.autograd import Variable
X = torch.randn(20,100) * 5 + 10
X = Variable(X)
B = nn.BatchNorm1d(100, affine=False)
y = B(X)
mu = torch.mean(X[:,1])
var_ = torch.var(X[:,1])
sigma = torch.sqrt(var_ + 1e-5)
x = (X[:,1] - mu)/sigma
#the ration below should be equal to one
print(x.data / y[:,1].data )
输出是:
0.9747
0.9747
0.9747
....
为BatchNorm2d
做同样的事情没有任何问题。 BatchNorm1d
如何计算其输出?
答案 0 :(得分:0)
找出原因。 mut self
在计算方差时使用贝塞尔的校正。传递属性torch.var
会给出相同的值。