Question

我有一个很大的数据集，并希望计算所有列和行的均值和标准差。不幸的是，我还没有合适的解决方案。我的数据集看起来像这样（总共600行）：

当我使用pandas函数weekl_rtr.mean()时，我只是计算每列的平均值。可能适用于平均值的解决方法应为weekl_rtr.mean().mean()，但这不适用于标准差。你有一个想法，如何解决这个问题？

谢谢您的问候

马库斯

Answer 1

据我所知，在熊猫中没有直接的方法可以做到。您有两种选择：

获取基础的numpy数组，并在其上计算均值或标准差。与熊猫相反，默认情况下它将评估所有尺寸的函数。例如，您可以在熊猫0.24+中执行class Print{ int data; public Print(int data) { this.data = data; } @Override public String toString(){ return String.format("[%d]",data); } }或df.values.mean()。
将表转换为单列，然后在该列上运行所需的操作

Answer 2

更改平均值和标准偏差的轴：

# Across columns (Default)
weekl_rtr.mean(axis = 0)
# or
weekl_rtr.mean()

# Across rows
weekl_rtr.mean(axis = 1)

std()也是如此。您还应该查看df.describe()，它描述了具有更多统计信息（平均值，标准，计数，最小，最大，百分位数）的DataFrame：

# Across columns
weekl_rtr.describe()

# Across rows
weekl_rtr.apply(pd.DataFrame.describe, axis=1)