我有一个具有DatetimeIndex的数据框。我想创建一个输入,用户将写入日期,然后python将查找第一个通过的月份。
以下是一个示例:df是数据框的名称
date = input('Enter a date in YYYY-MM-DD format: ')
Enter a date in YYYY-MM-DD format: 2017-01-31
我希望python会执行df [date-1],然后打印结果以便我得到:
2016-12-31 8.257478e+04
如果输入日期已经在索引中,那么这是可能的,但是当输入不是时,我正在寻找方法。
有什么想法吗?提前致谢
答案 0 :(得分:1)
value
的位置似乎需要get_loc
index
然后iloc
才能选择:
pos = df.index.get_loc(d)
print (df.iloc[[pos - 1]])
样品:
start = pd.to_datetime('2016-11-30')
rng = pd.date_range(start, periods=10, freq='M')
df = pd.DataFrame({'a': range(10)}, index=rng)
print (df)
a
2016-11-30 0
2016-12-31 1
2017-01-31 2
2017-02-28 3
2017-03-31 4
2017-04-30 5
2017-05-31 6
2017-06-30 7
2017-07-31 8
2017-08-31 9
d = '2017-01-31'
pos = df.index.get_loc(d)
print (df.iloc[[pos - 1]])
a
2016-12-31 1
如果date
不在index
添加method='nearest'
:
d = '2017-01-20'
pos = df.index.get_loc(d, method='nearest')
print (df.iloc[[pos - 1]])
a
2016-12-31 1
但如果需要更通用的解决方案,您必须使用以下条件:
d = '2017-11-30'
pos = df.index.get_loc(d, method='nearest')
if pos == 0:
print ('Value less or same as minimal date in DataTimeIndex')
else:
print ('Value nearest less or same as date', df.index[pos])
print ('Previous value', df.iloc[[pos - 1]])