所以这是一件有趣的事情:
使用python 2.7:
我有一个约5,100个条目的数据框,每个条目都有一个数字(熔点),标题为“Tm'”。使用代码:
self.sort_df[['Tm']].mean(axis=0)
我的意思是:
Tm 92.969204
dtype: float64
这没有意义,因为没有条目的Tm大于83.
.mean()不能用于这么多值吗?我已尝试配对数据集,它似乎适用于约1,000个条目,但考虑到我有150,000个完整数据集一次运行,我想知道我是否需要找到一种不同的计算方法均值。
答案 0 :(得分:1)
更可读的语法是:
sort_df['Tm'].mean()
尝试执行sort_df['Tm'].value_counts()
或sort_df['Tm'].max()
以查看存在的值。一些意想不到的值必须悄悄上升。
.mean
函数无论大小如何都能提供准确的结果。