这就是我所拥有的(此示例是原始数据的简化版本):
data = {'1': [22, 2, '2018-06-01'],
'2': [24, 2, '2018-06-30'],
'3': [28, 5, '2018-06-22'],
'4': [23, 4, '2018-06-02'],
'5': [23, 6, '2018-06-12'],
'6': [23, 2, '2018-06-22'],
'7': [22, 2, '2018-06-11']}
df = pd.DataFrame.from_dict(data, orient='index', columns=['ad_id', 'price', 'date'])
df
df的打印
ad_id price date
1 22 2 2018-06-01
2 24 2 2018-06-30
3 28 5 2018-06-22
4 23 4 2018-06-02
5 23 6 2018-06-12
6 23 2 2018-06-22
7 22 2 2018-06-11
我想得到:
2 24 2 2018-06-30
3 28 5 2018-06-22
6 23 2 2018-06-22
7 22 2 2018-06-11
如果ad_id
仅存在一个值,则返回的行将是该行(因为只有一个)。
如果ad_id
的值存在多个/重复项,而返回值最高的date
则返回行