我有一列看起来像这样的数据。
200705
200706
200707
200808
我想将其转换为具有年月日的列。 (2007/05/01)。
有问题的行是从csv文件中提取的,并定义为整数。
答案 0 :(得分:2)
我认为您需要datetimes
,因此仅使用to_datetime
:
df['date'] = pd.to_datetime(df['date'], format='%Y%m')
print (df)
date
0 2007-05-01
1 2007-06-01
2 2007-07-01
3 2008-08-01
如果还从文件添加参数parse_dates
中读取数据:
temp=u"""date
200705
200706
200707
200808"""
#after testing replace 'pd.compat.StringIO(temp)' to 'filename.csv'
df = pd.read_csv(pd.compat.StringIO(temp), parse_dates=['date'])
print (df)
date
0 2005-07-20
1 2006-07-20
2 2007-07-20
3 2008-08-20
但是如果需要字符串:
df['date'] = pd.to_datetime(df['date'], format='%Y%m').dt.strftime('%Y/%m/%d')
print (df)
date
0 2007/05/01
1 2007/06/01
2 2007/07/01
3 2008/08/01
或f-string
(Python 3.6及更高版本):
df['date'] = [f'{x[:-2]}/{x[-2:]}/01' for x in df['date'].astype(str)]
print (df)
date
0 2007/05/01
1 2007/06/01
2 2007/07/01
3 2008/08/01