我正在尝试从今天开始从特定数据框中查找不同的值。我理解resample可以做到这一点,但我们只能设置一个特定的任意日,例如:
df.resample('W-TUE')
从该特定日期开始每周重新采样数据帧(在本例中为星期二)。有没有办法从今天开始每周频率(动态即今天可能是星期一 - 星期日之间的任何一天)。
例如,如果我有一个看起来像这样的数据框,
sender_user_id created
0 2 2017-01-03 10:48:30.151437
1 2 2017-01-03 09:48:30.151437
2 5 2017-01-03 06:48:30.151437
3 14 2017-01-02 10:48:30.151437
4 12 2017-01-01 08:48:30.151437
5 11 2016-12-31 10:48:30.151437
6 17 2016-12-26 10:48:30.151437
7 21 2016-12-19 10:48:30.151437
我想从今天开始获取过去一周的唯一user_ids,这可能是任何一天(星期一 - 星期日)
答案 0 :(得分:1)
我认为您今天可以使用datetime make来“重新采样特定日期”,如下所示:
In [1]: import datetime
In [2]: now = datetime.datetime.now()
In [3]: print now.strftime('%a')
Wed
In [4]: print now.strftime('W-%a')
W-Wed
然后你可以使用resample。