我有一个以日期为索引的熊猫数据框。例如:
B group
index
2018-08-19 True
2018-08-20 True
2018-09-15 False
2018-09-15 False
2019-04-28 True
2019-06-01 False
2019-06-08 True
我只选择每个可用月份的第一个元素。例如,在此DF中,我要选择以下内容:
B group
index
2018-08-19 True
2018-09-15 False
2019-04-28 True
2019-06-01 False
我不知道该怎么做。所以我在这里问。预先感谢。
答案 0 :(得分:2)
用https://github.com/anselmh/object-fit将DatetimeIndex
转换为月份,然后用倒置掩码和DatetimeIndex.to_period
用Series.duplicated
进行过滤:
df = df[~df.index.to_period('m').duplicated()]
print (df)
B group
2018-08-19 True
2018-09-15 False
2019-04-28 True
2019-06-01 False