获取每组熊猫数据框的平均值

时间:2018-11-13 19:11:31

标签: python pandas time-series pandas-groupby

我成功地抓取了futbin.com,以获取FIFA 19球员的时间序列价格数据。我现在拥有超过200'000行的球员和价格数据。对于每个玩家,我大约有17种不同的价格(带有相应的时间戳).

我现在想制作一个新数据框,每个玩家只有一行,价格应该是该特定玩家随时间推移的平均价格。每个玩家都有一个唯一的“ Futbin_ID”号码。 直到现在我还无法弄清楚该怎么做... 如果有人可以帮助我,我将不胜感激。

1 个答案:

答案 0 :(得分:0)

您想按Fubin_ID对其进行分组,然后找到每个分组的平均值:

avg_price = df_ts.groupby('Futbin_ID')['price'].agg(np.mean)

如果您还希望将数据框与其他列一起使用,则可以将除第一列之外的所有重复项删除,然后将价格值替换为平均值:

df_ts.drop_duplicates(subset="Futbin_ID", keep="first", inplace= True)
df_ts.join[avg_price.set_index("Fubin_ID"), on="Futbin_ID"]

您可以在此处了解有关groupby的更多信息:https://www.tutorialspoint.com/python_pandas/python_pandas_groupby.htm