完整熊猫数据框的标准差和均值

时间:2019-11-23 15:20:44

标签: python pandas numpy dataframe

我有一个很大的数据集,并希望计算所有列和行的均值和标准差。不幸的是,我还没有合适的解决方案。 我的数据集看起来像这样(总共600行):

<code>df.head()</code> of dataset

当我使用pandas函数weekl_rtr.mean()时,我只是计算每列的平均值。可能适用于平均值的解决方法应为weekl_rtr.mean().mean(),但这不适用于标准差。 你有一个想法,如何解决这个问题?

谢谢您的问候

马库斯

2 个答案:

答案 0 :(得分:2)

据我所知,在熊猫中没有直接的方法可以做到。您有两种选择:

  1. 获取基础的numpy数组,并在其上计算均值或标准差。与熊猫相反,默认情况下它将评估所有尺寸的函数。例如,您可以在熊猫0.24+中执行class Print{ int data; public Print(int data) { this.data = data; } @Override public String toString(){ return String.format("[%d]",data); } } df.values.mean()
  2. 将表转换为单列,然后在该列上运行所需的操作

答案 1 :(得分:1)

更改平均值和标准偏差的轴:

# Across columns (Default)
weekl_rtr.mean(axis = 0)
# or
weekl_rtr.mean()

# Across rows
weekl_rtr.mean(axis = 1)

std()也是如此。您还应该查看df.describe(),它描述了具有更多统计信息(平均值,标准,计数,最小,最大,百分位数)的DataFrame:

# Across columns
weekl_rtr.describe()

# Across rows
weekl_rtr.apply(pd.DataFrame.describe, axis=1)