我目前有以下输出:
df.Date
0 2020/2/29 12:40:0
1 2020/2/29 12:50:0
2 2020/2/29 13:0:0
3 2020/2/29 13:10:0
4 2020/2/29 13:20:0
...
21525 2020/7/28 10:10:0
21526 2020/7/28 10:20:0
21527 2020/7/28 10:30:0
21528 2020/7/28 10:40:0
21529 2020/7/28 10:50:0
Name: Date, Length: 21530, dtype: object
我想消除年份,小时,分钟和秒,只保留月份和日期:
0 2/29
1 2/29
2 2/29
3 2/29
4 2/29
...
21525 7/28
21526 7/28
我尝试使用replace
函数,但是它以某种方式弄乱了我的数据:
df.Date = df.Date.str.replace('2020/' , '')
df.Date = df.Date.str.replace('..:..:.' , '')
还有其他方法吗?
答案 0 :(得分:1)
执行以下操作:
df.date = pd.to_datetime(df.date)
df.date.dt.strftime("%m/%d")
输出为:
0 02/29
1 02/29
2 02/29
3 02/29
4 02/29
5 07/28
...
答案 1 :(得分:0)
import pandas as pd
import numpy as np
dates = pd.date_range('2020-01-01', periods=500, freq='D')
df = pd.DataFrame({ 'date' : dates})
df['month_day'] = df.date.apply(lambda x: f"{x.month}/{x.day}")