我有一个非常大的数据集:https://archive.ics.uci.edu/ml/datasets/individual+household+electric+power+consumption
它包含约250万行。 Pandas数据框索引是一个时间戳,然后有几列。
我想过滤数据集,所以我只能看到例如所有年份的9AM(09:00:00)行(大约1400行-> 365 * 4)
The Pandas dataframe looks like this
我已经尝试过了:
dataset.groupby(dataset.index.hour == '09:00:00')
但是它不起作用。我也尝试了以下成功:
dataset['09:00:00']
谢谢
答案 0 :(得分:1)
您的两次尝试都将结束!应该可以使用布尔掩码选择所需的行,如下所示:
dataset[dataset.index.hour == 9]