我正在尝试创建一个新列,其中包含另一列的均值(按组)。当我检查运行步骤的输出后,所有值均为nan。
我已经交叉检查了数据,以检查是否缺少任何值或空白等。没有任何问题。我还用excel进行了计算以交叉检查数据,并且可以计算每组的平均值。
XXX["VAR_MEAN1"] = XXX.groupby(['KEY'])['Variable1'].mean()
输出:
count 0.000
mean nan
std nan
min nan
25% nan
50% nan
75% nan
max nan
预期结果(来自excel)
KEY,MEAN
8Y2657000J8Y5683000C,1217.311538
8Y4007200J8Y5395000B,636.1032999
答案 0 :(得分:0)
尝试首先删除变量的空条目:
XXX["VAR_MEAN1"] = (XXX
.dropna(subset=['Variable1'])
.groupby(['KEY'])['Variable1']
.mean()
)