使用第三个值从dataframe中提取两个值

时间:2017-11-02 22:08:49

标签: python dataframe extract

我有一个这样的数据框:

ID  TYPE     VALUE 
1     h        45
1     l        50
2     g        60
2     h        99
2     l        65
3     h        11
3     l        13
3     k        22 

我需要根据每个ID的最大VALUE提取ID和TYPE。

结束

1     l
2     h
3     k

刚开始使用Python,并且不知道从哪里开始。

提前致谢!

2 个答案:

答案 0 :(得分:0)

您在这里需要一些pandas功能,尤其是groupby()

idx = df.groupby(['ID'])['VALUE'].transform(max) == df['VALUE']
df[idx]

哪个收益

    ID  TYPE    VALUE
1   1   l       50
3   2   h       99
7   3   k       22

答案 1 :(得分:0)

您希望将https://docs.aws.amazon.com/AmazonS3/latest/API/RESTObjectPUT.htmlgroupby一起使用:

df[df.groupby(['ID'])['VALUE'].idxmax()]

    ID  TYPE    VALUE
1   1   l       50
3   2   h       99
7   3   k       22