为什么np.std(X)和X.std()返回不同的值?

时间:2019-07-24 07:46:14

标签: pandas numpy statistics standard-deviation

我正在尝试使用均值归一化为我的数据集计算归一化分数。当我写(X - np.mean(X))/np.std(X)时,它给我的分数与((X - X.mean())/X.std()不同。

问题似乎来自标准偏差的计算。 X.std()返回一个标准偏差值,np.std()返回不同的标准化值。为什么会这样?

1 个答案:

答案 0 :(得分:3)

  

Pandas使用无偏估计量(分母为N-1),而   默认情况下,Numpy不会。

     

要使它们的行为相同,请将ddof=1传递到numpy.std()

Different std in pandas vs numpy