我有一个很大的数据集,并希望计算所有列和行的均值和标准差。不幸的是,我还没有合适的解决方案。 我的数据集看起来像这样(总共600行):
当我使用pandas函数weekl_rtr.mean()
时,我只是计算每列的平均值。可能适用于平均值的解决方法应为weekl_rtr.mean().mean()
,但这不适用于标准差。
你有一个想法,如何解决这个问题?
谢谢您的问候
马库斯
答案 0 :(得分:2)
据我所知,在熊猫中没有直接的方法可以做到。您有两种选择:
class Print{
int data;
public Print(int data) {
this.data = data;
}
@Override
public String toString(){
return String.format("[%d]",data);
}
}
或df.values.mean()
。答案 1 :(得分:1)
更改平均值和标准偏差的轴:
# Across columns (Default)
weekl_rtr.mean(axis = 0)
# or
weekl_rtr.mean()
# Across rows
weekl_rtr.mean(axis = 1)
std()
也是如此。您还应该查看df.describe()
,它描述了具有更多统计信息(平均值,标准,计数,最小,最大,百分位数)的DataFrame:
# Across columns
weekl_rtr.describe()
# Across rows
weekl_rtr.apply(pd.DataFrame.describe, axis=1)