来自PANDAS数据帧的错误均值

时间:2015-05-23 09:44:31

标签: python python-2.7 pandas

所以这是一件有趣的事情:

使用python 2.7:

我有一个约5,100个条目的数据框,每个条目都有一个数字(熔点),标题为“Tm'”。使用代码:

self.sort_df[['Tm']].mean(axis=0)

我的意思是:

Tm    92.969204
dtype: float64

这没有意义,因为没有条目的Tm大于83.

.mean()不能用于这么多值吗?我已尝试配对数据集,它似乎适用于约1,000个条目,但考虑到我有150,000个完整数据集一次运行,我想知道我是否需要找到一种不同的计算方法均值。

1 个答案:

答案 0 :(得分:1)

更可读的语法是:

sort_df['Tm'].mean()

尝试执行sort_df['Tm'].value_counts()sort_df['Tm'].max()以查看存在的值。一些意想不到的值必须悄悄上升。

.mean函数无论大小如何都能提供准确的结果。