我得到的DataFrame包含“开始日期”和“结束日期”列。
DECLARE @I1 int = 1;
SELECT CASE WHEN @I1 > 26
THEN CHAR(64 + (@I1 / 26)) + CHAR(64 + (@I1 % 26))
ELSE CHAR(64 + @I1)
END + '.'
我想创建一个包含此范围内月份列表的列,如下所示:
start_date finish_date
0 2019-06-16 2019-06-23
1 2019-05-29 2019-06-05
2 2019-03-26 2019-03-28
3 2019-04-22 2019-04-24
4 2019-05-08 2019-05-08
我尝试使用period_range:
start_date finish_date range
0 2019-06-16 2019-06-23 [2019-06]
1 2019-05-29 2019-06-05 [2019-05, 2019-06]
2 2019-03-26 2019-03-28 [2019-03]
3 2019-04-22 2019-08-24 [2019-04, 2019-05, 2019-06, 2019-07]
4 2018-12-08 2019-02-08 [2018-12, 2019-01, 2019-02]
类似这样,但是我只有错误。 您能帮我吗-可以使用period_range / date_range解决我的问题吗?
感谢您的时间!
答案 0 :(得分:4)
尝试:
df['range'] = pd.Series([pd.date_range(i, j, freq='D').strftime('%Y-%m').unique().to_numpy()
for i, j in zip(df['start_date'], df['finish_date'])])
print(df)
输出:
start_date finish_date range
0 2019-06-16 2019-06-23 [2019-06]
1 2019-05-29 2019-06-05 [2019-05, 2019-06]
2 2019-03-26 2019-03-28 [2019-03]
3 2019-04-22 2019-08-24 [2019-04, 2019-05, 2019-06, 2019-07, 2019-08]
4 2018-12-08 2019-02-08 [2018-12, 2019-01, 2019-02]