使用偏移量舍入Pandas时间戳

时间:2018-03-30 14:09:07

标签: python pandas timestamp resampling

我想使用Timestamp围绕(发布)一只熊猫pandas.tseries.offsets(就像重新采样时间序列但只有一行时)

import pandas as pd
from pandas.tseries.frequencies import to_offset
freq = to_offset("H")
dt = pd.Timestamp('2017-01-03 05:02:00')
# what should I do
# to get pd.Timestamp('2017-01-03 05:00:00')

我想知道pandas.core.resample.TimeGrouper是否可以提供帮助

grouper = pd.Grouper(freq="H")

2 个答案:

答案 0 :(得分:1)

可能有一种方法可以通过补偿来实现,但如果您只是想尝试"地板"格式为'%H:00:00'的时间戳,您也可以使用replacepd.Timestamps继承的datetime.datetime方法(参见this answer

dt = pd.Timestamp('2017-01-03 05:02:00')

dt.replace(minute=0, second=0)

# Timestamp('2017-01-03 05:00:00')

如果你想在整个日期时间列上执行此操作,可以将其应用为lambda:

df = pd.DataFrame(pd.date_range('2018-01-01 09:00:00','2018-01-01 10:00:00', freq='S'), columns = ['datetime'])

>>> df.head()
             datetime
0 2018-01-01 09:00:00
1 2018-01-01 09:00:01
2 2018-01-01 09:00:02
3 2018-01-01 09:00:03
4 2018-01-01 09:00:04

df['datetime'] = df.datetime.apply(lambda x: x.replace(minute=0, second=0))

>>> df.head()
0   2018-01-01 09:00:00
1   2018-01-01 09:00:00
2   2018-01-01 09:00:00
3   2018-01-01 09:00:00
4   2018-01-01 09:00:00

答案 1 :(得分:1)

可以使用时间频率字符串对时间戳进行四舍五入:

https://pandas.pydata.org/pandas-docs/stable/generated/pandas.Timestamp.floor.html

pd.Timestamp.now().floor('M')
pd.Timestamp.now().floor('H')
pd.Timestamp.now().floor('D')