如何只在大熊猫中加入时间戳?

时间:2018-06-17 08:26:13

标签: python pandas datetime

我有一个数据框df

user    timestamp  amount
us67    15:59:07   87
us90    17:12:19   10
us12    03:23:16   17

print(df.timestamp[0])
>>> datetime.time(15,59,7)

我想将所有时间分成1小时,所以总共24个时间间隔。但是,我得到TypeError

df['timestamp'] = pd.cut(x=df['timestamp'], bins=24)
>>> TypeError: unsupported operand type(s) for +: 'datetime.time' and 'float'

但是,如果日期包含在timestamp列中,但该方法确实有效,但我想忽略日期并仅保留时间(以便稍后绘制):

user    timestamp                 amount
us67    2018-04-29 15:59:07.455   87
us90    2018-04-29 17:12:19.128   10
us12    2018-04-29 03:23:16.890   17

print(df.timestamo[0])
>>> Timestamp('2018-04-29 15:59:07.455000')

df['timestamp'] = pd.cut(x=df['timestamp'], bins=24)

使用上面timestamp的格式,分箱有效。但是,我不希望时间戳或间隔中的年份和日期。我只想关注一天中的时间。

有没有办法只使用一天中的时间来装箱timestamp?最终,这里的目标是使用一天中的小时而不是日期来绘制dftimestampamount)的时间序列 - 所以如果有更好的方法可以做到这一点,请提出建议。

1 个答案:

答案 0 :(得分:0)

我会使用dt.hour

创建一个包含已装箱时间的列

所以

df["binned_hours"] = pd.cut(df.timestamp.dt.hour, bins=24)