我有一张包含分钟数据的表。该表中缺少一些行。
import pandas as pd
df = pd.DataFrame([
("2019-02-15 17:56:00", 11, 10),
("2019-02-15 17:57:00", 22, 10),
("2019-02-15 18:00:00", 33, 20),
("2019-02-15 18:01:00", 44, 20),
("2019-02-15 18:02:00", 55, 20),
("2019-02-16 10:01:00", 66, 50),
("2019-02-16 10:02:00", 77, 50)],
columns=["date_time", "last_val", "sum_val"])
我需要获取一个包含每小时数据的表。 last_val
列中一个小时中的最后一个值。并且在sum_val
列中将是每小时所有值的总和。
要使结果表看起来像这样:
答案 0 :(得分:1)
您的组密钥不是很容易找到,首先需要将date_time
切片到hour
并转换回datetime
对象,然后用{{1 }}
groupby