熊猫标准差奇迹

时间:2015-08-17 17:41:52

标签: pandas standard-deviation

这是我的代码:

import pandas as pd
df = pd.DataFrame({'Test': [861166021755746, 861166021755746, 861166021755746]})
print(df.describe())

这是输出(请注意std的值):

Test
count  3.000000e+00
mean   8.611660e+14
std    1.186328e+07
min    8.611660e+14
25%    8.611660e+14
50%    8.611660e+14
75%    8.611660e+14
max    8.611660e+14

std的正确值为零,因为所有三个数字都相同。

现在我将上面的数据框用数字9替换第一个数字8

df = pd.DataFrame({'Test': [961166021755746, 961166021755746, 961166021755746]})
print(df.describe())

现在的输出是(请注意标准号码):

Test
count  3.000000e+00
mean   9.611660e+14
std    0.000000e+00
min    9.611660e+14
25%    9.611660e+14
50%    9.611660e+14
75%    9.611660e+14
max    9.611660e+14

我找到了神奇的数字或者发生了什么事吗?

1 个答案:

答案 0 :(得分:1)

此问题确实是与方差计算错误有关的错误,已在版本0.17.0中得到解决。如果您使用任何以前的版本,则应将其更新到较新的版本,或按照环境中的注释安装bottleneck中的建议进行操作。