如何在pandas中的DataFrame列中提取第n个最大值/最小值?

时间:2017-12-29 17:48:04

标签: python pandas dataframe max min

我想从pandas中DataFrame的数字列中获取第n个最小值或第n个最大值。

示例:

df = pd.DataFrame({'a': [3.0, 2.0, 4.0, 1.0],'b': [1.0, 4.0 , 2.0, 3.0]})

     a    b
0  3.0  1.0
1  2.0  4.0
2  4.0  2.0
3  1.0  3.0

a中的第三大值为2,列b中的第二个最小值也为2.

2 个答案:

答案 0 :(得分:4)

您可以使用nlargest / nsmallest -

df    
     a    b
0  3.0  1.0
1  2.0  4.0
2  4.0  2.0
3  1.0  3.0
df.a.nlargest(3).iloc[-1]
2.0

或者,

df.a.nlargest(3).iloc[[-1]]

1    2.0
Name: a, dtype: float64

至于b -

df.b.nsmallest(2).iloc[-1]
2.0

或者,

df.b.nsmallest(2).iloc[[-1]]

2    2.0
Name: b, dtype: float64

此处快速观察 - 此类操作无法进行矢量化。你实际上是在这里执行两个完全不同的操作。

答案 1 :(得分:0)

df =  
     a    b
0  3.0  1.0
1  2.0  4.0
2  4.0  2.0
3  1.0  3.0

df.nlargest(3,'a')
   =2.0

df.nsmallest(2,'b')=2.0