我正在处理包含日期的数据框。 我想创建一个新列来对一年中日期的时间段进行分类。这意味着我将假设每2个月为一个范围。但是我的开始日期是八月。因此,
Aug to Sep is 1,
Oct to Nov is 2,
Dec to Jan is 3,
Feb to Mar is 4 and
Apr to May is 5.
采样日期如下:
data =pd.DataFrame()
data ['Date'] = ['27-03-2019','08-10-2019','09-04-2019','09-08-2018']
data.period = pd.to_datetime(data['Date'])
在新列中的预期结果范围如下:
有人可以建议我怎么做吗?
非常感谢
Zep。
答案 0 :(得分:3)
import pandas as pd
df =pd.DataFrame()
df ['Date'] = ['27-03-2019','10-08-2019','04-09-2019','08-09-2018']
df.Date = pd.to_datetime(df['Date'])
month_range={8:1,9:1,10:2,11:2,12:3,1:3,2:4,3:4,4:5,5:5,6:6,7:6}
df['Range'] = [month_range.get(d) for d in df['Date'].dt.month]
输出:
Date Range
0 2019-03-27 4
1 2019-10-08 2
2 2019-04-09 5
3 2018-08-09 1
答案 1 :(得分:1)
我尝试使用numpy.roll
,numpy.repeat
,numpy.arange
创建字典,最后将Series.map
与Series.dt.month
一起使用:
a = np.arange(1, 13)
b = np.roll(np.repeat(np.arange(1,7), 2), 7)
d = dict(zip(a, b))
print (d)
{1: 3, 2: 4, 3: 4, 4: 5, 5: 5, 6: 6, 7: 6, 8: 1, 9: 1, 10: 2, 11: 2, 12: 3}
df['Range'] = df['Date'].dt.month.map(d)
print (df)
Date Range
0 2019-03-27 4
1 2019-10-08 2
2 2019-04-09 5
3 2018-08-09 1