应用错误收集

为什么np.std（X）和X.std（）返回不同的值？

时间：2019-07-24 07:46:14

标签： pandas numpy statistics standard-deviation

我正在尝试使用均值归一化为我的数据集计算归一化分数。当我写(X - np.mean(X))/np.std(X)时，它给我的分数与((X - X.mean())/X.std()不同。

问题似乎来自标准偏差的计算。 X.std()返回一个标准偏差值，np.std()返回不同的标准化值。为什么会这样？

1 个答案:

答案 0 :(得分：3)

Pandas使用无偏估计量（分母为N-1），而   默认情况下，Numpy不会。

要使它们的行为相同，请将ddof=1传递到numpy.std()。

Different std in pandas vs numpy