如何按时间/日期重新分区数据框中的数据

时间:2016-05-16 16:37:27

标签: python date pandas dataframe

我一直在寻找答案,但到目前为止,我仍然坚持这个问题。我必须根据给定的数据编写位置推荐软件。 数据具有以下结构:

UserID  VenueID CategoryID  CategoryName    Latitude    Longitude   TimezoneOffset  UTCtime
470 49bbd6c0f964a520f4531fe3    4bf58dd8d48988d127951735    Arts & Crafts Store 40.719810375488535  -74.00258103213994  -240    Tue Apr 03 18:00:09 +0000 2012

我的软件将获得userID,categoryID和日期作为输入,软件应该只考虑到给定日期的数据(推荐)(yyyy-dd-mm足够,没有小时,分钟等)

如何选择数据,直到例如2012-04-12?我已经看到很多解决方案使得datetime成为索引,但是虽然我有227428个日期,但只有224653是唯一的,所以我不知道这是否有用。

我必须将dateframe条目从string转换为datetime。这适用于pandas.to_datetime,但我如何将其应用于我的软件(例如语法)。 这显然不起作用:

df2 = df[df['UTCtime']<date_input]

感谢您提供任何帮助,并询问您是否需要更多信息。

1 个答案:

答案 0 :(得分:0)

好的,我明白了。我单独转换了我的&#39; UTCtime&#39;列到datetime对象并将其添加到我的数据帧。然后我能够限制。 ;)