让我们按如下方式定义DataFrame a并打印它
a = pd.DataFrame([[10,1,5],[20,2,6],[10,3,7]],columns=['a','b','c'])
print(a)
给出了
a b c
0 10 1 5
1 20 2 6
2 10 3 7
的输出
print(a[['b']].groupby(a.a, as_index=True).first())
是
b
a
10 1
20 2
的输出
print(a[['b']].groupby(a.a, as_index=True).nth(0))
是
b
0 1
1 2
因此忽略as_index=True
,这与先前的命令(使用.first()
)不一致。现在输出
print(a[['a','b']].groupby(a.a, as_index=True).nth(0))
是
a b
a
10 10 1
20 20 2
再次不一致。