我有一个数据框,其中有一列是日期时间序列对象。它在另一列中具有与每个日期关联的一些数据。年份范围是2005-2014。我想将每年相似的日期归为一组,即必须将2005-15年1月1日之前的所有日期归为一组,而与年份无关。同样地,一年中的所有365天也是如此。所以我应该有365天的输出。我该怎么办?
答案 0 :(得分:0)
假设您的DataFrame具有一列Date
,则可以使其成为DataFrame的索引,然后使用strftime
转换为仅包含日期和月份的格式(例如"%m-%d"
),groupby
和适当的功能(我刚刚使用过mean
):
df = df.set_index('Date')
df.index = df.index.strftime("%m-%d")
dfAggregated = df.groupby(level=0).mean()
请注意,由于leap年,输出将有366天。您可能要过滤掉与2月29日相关的数据,或将其合并到2月28日/ 3月1日(取决于应用程序的特定用例)