我正在尝试选择两个日期之间的数据框的子集。
我有一个接受数据框和两个日期的函数。然后,它在日期之间返回一个数据框。
In [4]: df = pd.DataFrame([['F',10,'2019-08-10 10:30:00'],['M',5,'2019-08-11 10:30:00'],['M',8,'2019-08-12 10:30:00'],['F',5,'2019-08-13 10:30:00'], ['M',5,'2019-08-14 10:30:00'],['F',20,'2019-08-15 10:30:00'],['M',20,'2019-08-16 10:30:00']], columns=['GENDER','Age','DATE'])
>>> df
Out[5]:
GENDER Age DATE
0 F 10 2019-08-10 10:30:00
1 M 5 2019-08-11 10:30:00
2 M 8 2019-08-12 10:30:00
3 F 5 2019-08-13 10:30:00
4 M 5 2019-08-14 10:30:00
5 F 20 2019-08-15 10:30:00
6 M 20 2019-08-16 10:30:00
我的功能是
def select_student(df,start,end):
df = df[(df["DATE"] >= start) & (df["DATE"] <= end)]
return df
start,end = (pd.to_datetime('2019-08-10 10:30:00'),pd.to_datetime('2019-
08-15 10:30:00'))
当我运行该功能时,
df = select_student(df)
我收到错误TypeError: '>=' not supported between instances of 'str' and 'Timestamp'