使用一天中的特定时间或小时过滤熊猫数据框

时间:2019-03-18 14:19:25

标签: python pandas datetime group-by timestamp

我有一个非常大的数据集:https://archive.ics.uci.edu/ml/datasets/individual+household+electric+power+consumption

它包含约250万行。 Pandas数据框索引是一个时间戳,然后有几列。

我想过滤数据集,所以我只能看到例如所有年份的9AM(09:00:00)行(大约1400行-> 365 * 4)

The Pandas dataframe looks like this

我已经尝试过了:

dataset.groupby(dataset.index.hour == '09:00:00')

但是它不起作用。我也尝试了以下成功:

dataset['09:00:00']

谢谢

1 个答案:

答案 0 :(得分:1)

您的两次尝试都将结束!应该可以使用布尔掩码选择所需的行,如下所示:

dataset[dataset.index.hour == 9]