我有一个数据框df
user timestamp amount
us67 15:59:07 87
us90 17:12:19 10
us12 03:23:16 17
print(df.timestamp[0])
>>> datetime.time(15,59,7)
我想将所有时间分成1小时,所以总共24个时间间隔。但是,我得到TypeError
df['timestamp'] = pd.cut(x=df['timestamp'], bins=24)
>>> TypeError: unsupported operand type(s) for +: 'datetime.time' and 'float'
但是,如果日期包含在timestamp
列中,但该方法确实有效,但我想忽略日期并仅保留时间(以便稍后绘制):
user timestamp amount
us67 2018-04-29 15:59:07.455 87
us90 2018-04-29 17:12:19.128 10
us12 2018-04-29 03:23:16.890 17
print(df.timestamo[0])
>>> Timestamp('2018-04-29 15:59:07.455000')
df['timestamp'] = pd.cut(x=df['timestamp'], bins=24)
使用上面timestamp
的格式,分箱有效。但是,我不希望时间戳或间隔中的年份和日期。我只想关注一天中的时间。
有没有办法只使用一天中的时间来装箱timestamp
?最终,这里的目标是使用一天中的小时而不是日期来绘制df
(timestamp
与amount
)的时间序列 - 所以如果有更好的方法可以做到这一点,请提出建议。
答案 0 :(得分:0)
我会使用dt.hour
所以
df["binned_hours"] = pd.cut(df.timestamp.dt.hour, bins=24)