我想从pandas中DataFrame
的数字列中获取第n个最小值或第n个最大值。
示例:
df = pd.DataFrame({'a': [3.0, 2.0, 4.0, 1.0],'b': [1.0, 4.0 , 2.0, 3.0]})
a b
0 3.0 1.0
1 2.0 4.0
2 4.0 2.0
3 1.0 3.0
列a
中的第三大值为2,列b
中的第二个最小值也为2.
答案 0 :(得分:4)
您可以使用nlargest
/ nsmallest
-
df
a b
0 3.0 1.0
1 2.0 4.0
2 4.0 2.0
3 1.0 3.0
df.a.nlargest(3).iloc[-1]
2.0
或者,
df.a.nlargest(3).iloc[[-1]]
1 2.0
Name: a, dtype: float64
至于b
-
df.b.nsmallest(2).iloc[-1]
2.0
或者,
df.b.nsmallest(2).iloc[[-1]]
2 2.0
Name: b, dtype: float64
此处快速观察 - 此类操作无法进行矢量化。你实际上是在这里执行两个完全不同的操作。
答案 1 :(得分:0)
df =
a b
0 3.0 1.0
1 2.0 4.0
2 4.0 2.0
3 1.0 3.0
df.nlargest(3,'a')
=2.0
df.nsmallest(2,'b')=2.0