Question

我有一个数据框df

user    timestamp  amount
us67    15:59:07   87
us90    17:12:19   10
us12    03:23:16   17

print(df.timestamp[0])
>>> datetime.time(15,59,7)

我想将所有时间分成1小时，所以总共24个时间间隔。但是，我得到TypeError

df['timestamp'] = pd.cut(x=df['timestamp'], bins=24)
>>> TypeError: unsupported operand type(s) for +: 'datetime.time' and 'float'

但是，如果日期包含在timestamp列中，但该方法确实有效，但我想忽略日期并仅保留时间（以便稍后绘制）：

user    timestamp                 amount
us67    2018-04-29 15:59:07.455   87
us90    2018-04-29 17:12:19.128   10
us12    2018-04-29 03:23:16.890   17

print(df.timestamo[0])
>>> Timestamp('2018-04-29 15:59:07.455000')

df['timestamp'] = pd.cut(x=df['timestamp'], bins=24)

使用上面timestamp的格式，分箱有效。但是，我不希望时间戳或间隔中的年份和日期。我只想关注一天中的时间。

有没有办法只使用一天中的时间来装箱timestamp？最终，这里的目标是使用一天中的小时而不是日期来绘制df（timestamp与amount）的时间序列 - 所以如果有更好的方法可以做到这一点，请提出建议。

Answer 1

我会使用dt.hour

创建一个包含已装箱时间的列

所以

df["binned_hours"] = pd.cut(df.timestamp.dt.hour, bins=24)

如何只在大熊猫中加入时间戳？

1 个答案: