我有一个看起来像这样的数据框:
date data
2013-09-03 10
2013-09-04 9
2013-10-03 14
2014-09-02 13
2015-08-07 12
2016-09-02 17
然后我应用下面的代码仅选择第9个月
import pandas as pd
import datetime as dt
df= df[df['Date'].dt.month == 9] # select only the 9th month
这使我得到以下信息:
date data
2013-09-03 10
2013-09-04 9
2014-09-02 13
2016-09-02 17
但是我要创建的是每次选择第9个月时都创建一列,以便它可以成为单独的列:
date data 2013 2014 2016
2013-09-03 10 10
2013-09-04 9 9
2014-09-07 13 13
2016-09-08 17 17
我认为我必须在for循环中使用dt.year函数为每一年创建一列,但是我认为在熊猫中可能有一个更简单的解决方案?
答案 0 :(得分:0)
您可以尝试crosstab
s = pd.crosstab(index=df.index,columns=df.date.dt.year,values=df.data,aggfunc='sum').fillna('')
df = df.join(s)
df
Out[45]:
date data 2013 2014 2016
0 2013-09-03 10 10
1 2013-09-04 9 9
2 2014-09-02 13 13
3 2016-09-02 17 17