我的数据框是这样的:
YearMonth Number of Visitors
Jan-91 177400
Feb-91 190600
Mar-91 189200
Apr-91 168000
May-91 161400
我想将索引转换为1991-01之类的东西。我尝试使用index.to_datetime但收到错误:
ValueError: day is out of range for month
我的代码如下:
dataC = pd.read_csv('Visitors.csv', index_col='YearMonth', parse_dates=True, dayfirst=True)
dataC.index = dataC.index.to_datetime(dayfirst=True)
我可以实现我的目标吗?
答案 0 :(得分:2)
对我来说,解决方案的第一部分为我工作:
import pandas as pd
from io import StringIO
pd.options.display.max_columns = 20
temp="""YearMonth,Number of Visitors
Jan-91,177400
Feb-91,190600
Mar-91,189200
Apr-91,168000
May-91,161400"""
#after testing replace 'pd.compat.StringIO(temp)' to 'Visitors.csv'
dataC = pd.read_csv(StringIO(temp), index_col='YearMonth', parse_dates=True)
print (dataC)
Number of Visitors
YearMonth
1991-01-01 177400
1991-02-01 190600
1991-03-01 189200
1991-04-01 168000
1991-05-01 161400
print (dataC.index)
DatetimeIndex(['1991-01-01', '1991-02-01', '1991-03-01', '1991-04-01',
'1991-05-01'],
dtype='datetime64[ns]', name='YearMonth', freq=None)
如果要使用其他格式,一种可能的解决方案是按DataFrame.to_period
使用月份:
dataC = dataC.to_period('m')
print (dataC)
Number of Visitors
YearMonth
1991-01 177400
1991-02 190600
1991-03 189200
1991-04 168000
1991-05 161400
print (dataC.index)
PeriodIndex(['1991-01', '1991-02', '1991-03', '1991-04', '1991-05'],
dtype='period[M]', name='YearMonth', freq='M')
在您的解决方案中,如果要将索引转换为DatemeIndex
,则正确的解决方案是使用format
参数的to_datetime
:
dataC.index = pd.to_datetime(dataC.index, format='%b-%y')