我正在尝试使用均值归一化为我的数据集计算归一化分数。当我写(X - np.mean(X))/np.std(X)
时,它给我的分数与((X - X.mean())/X.std()
不同。
问题似乎来自标准偏差的计算。 X.std()
返回一个标准偏差值,np.std()
返回不同的标准化值。为什么会这样?
答案 0 :(得分:3)
Pandas使用无偏估计量(分母为N-1),而 默认情况下,Numpy不会。
要使它们的行为相同,请将
ddof=1
传递到numpy.std()
。