按组创建平均值的列

时间:2018-12-26 08:55:34

标签: python

我正在尝试创建一个新列,其中包含另一列的均值(按组)。当我检查运行步骤的输出后,所有值均为nan。

我已经交叉检查了数据,以检查是否缺少任何值或空白等。没有任何问题。我还用excel进行了计算以交叉检查数据,并且可以计算每组的平均值。

XXX["VAR_MEAN1"] = XXX.groupby(['KEY'])['Variable1'].mean()

运行上面的代码后,我看到的

输出:

count   0.000
mean      nan
std       nan
min       nan
25%       nan
50%       nan
75%       nan
max       nan

预期结果(来自excel)

KEY,MEAN
8Y2657000J8Y5683000C,1217.311538
8Y4007200J8Y5395000B,636.1032999

sampledata

1 个答案:

答案 0 :(得分:0)

尝试首先删除变量的空条目:

XXX["VAR_MEAN1"] = (XXX
                      .dropna(subset=['Variable1'])
                      .groupby(['KEY'])['Variable1']
                      .mean()
                   )