我有一个数据框,每日库存数据超过10年历史。有没有一种简单的方法可以将其转化为年度变化,因此排在2010年,2011年...... 2017年等而不是每天?它只需要显示每列的年度变化。
答案 0 :(得分:1)
如果您的日期格式为datetime
,则可以创建新列Year
:
df['Year'] = df['Date'].apply(lambda x: x.year)
现在您可以按年度对数据进行分组,我假设您需要sum
:
df = df.groupby('Year', as_index=False)[list_of_columns_you_need].sum()
或者,如果您需要对每列进行不同的操作,可以使用agg
:
df = df.groupby('Year', as_index=False).agg('column1': 'sum', 'column2': 'mean') #hope you get the idea