DataFrame:如何将Z分组并计算Y范围内的平均值X

时间:2019-07-27 05:43:03

标签: python-3.x dataframe pandas-groupby

我有一个数据帧,其中包括3列-TestXY。我想添加新列Xmean,其中包括X的平均值,每个Y的条件为Test

例如Xmean包含X的平均值,而Y >= 5包含每个Test的平均值。

enter image description here

1 个答案:

答案 0 :(得分:0)

将熊猫作为pd导入

df = pd.read_csv(r'Downloads \ test.txt',delimiter =',',encoding ='utf-8')

df_sort = df.sort_values(“ test”)

df_filter = df_sort [df_sort ['y']> = 5]

应用聚合函数求均值

df_agg = df_filter.groupby(['test'])['x']。mean()

加入两个数据框以获得所需的输出

df_final = pd.merge(df_sort [['test','x','y']],df_agg,on ='test')

print(df_final)

Output attached