我有一个数据框,其中所有标头都是字符串格式。但是,大多数标题实际上都是YYYY-MM日期,我想将其更改为日期格式。
ldnCrimes.columns:
Index(['WardCode', 'Ward Name', 'Borough', 'Major Category', 'Minor Category',
'2010-04', '2010-05', '2010-06', '2010-07', '2010-08',
...
'2018-03', '2018-04', '2018-05', '2018-06', '2018-07', '2018-08',
'2018-09', '2018-10', '2018-11', '2018-12'],
dtype='object', length=110)`
尝试时:
ldnCrime.columns = ldnCrime.columns[:1].tolist() + pd.to_datetime(ldnCrime.columns[5:]).tolist()
但随后出现以下错误:
ValueError:长度不匹配:预期轴有110个元素,新值有106个元素
这4个元素是非日期标头,我不想更改其格式。
但随后出现以下错误:
ValueError:长度不匹配:预期轴有110个元素,新值有106个元素
这4个元素是非日期标头,我不想更改其格式。
在此先感谢您提供的任何帮助。
答案 0 :(得分:1)
使用@Henry Yik评论的解决方案-选择第一个5
值:
idx = ['WardCode', 'Ward Name', 'Borough', 'Major Category', 'Minor Category',
'2010-04', '2010-05', '2010-06', '2010-07', '2010-08',
'2018-03', '2018-04', '2018-05', '2018-06', '2018-07', '2018-08',
'2018-09', '2018-10', '2018-11', '2018-12']
ldnCrime = pd.DataFrame(columns=idx)
ldnCrime.columns = ldnCrime.columns[:5].tolist()+pd.to_datetime(ldnCrime.columns[5:]).tolist()
另一个想法是将值转换为Series
并使用fillna
:
c = ldnCrime.columns.to_series()
ldnCrime.columns = pd.to_datetime(c, errors='coerce').fillna(c)
print (ldnCrime.columns)
Index([ 'WardCode', 'Ward Name', 'Borough',
'Major Category', 'Minor Category', 2010-04-01 00:00:00,
2010-05-01 00:00:00, 2010-06-01 00:00:00, 2010-07-01 00:00:00,
2010-08-01 00:00:00, 2018-03-01 00:00:00, 2018-04-01 00:00:00,
2018-05-01 00:00:00, 2018-06-01 00:00:00, 2018-07-01 00:00:00,
2018-08-01 00:00:00, 2018-09-01 00:00:00, 2018-10-01 00:00:00,
2018-11-01 00:00:00, 2018-12-01 00:00:00],
dtype='object')