我碰到了这段代码,想知道它的机制。
df.set_index('STNAME').groupby(level=0)['CENSUS2010POP']
.agg({'avg': np.average, 'sum': np.sum}))
avg sum
STNAME
Alabama 71339.343284 4779736
Alaska 24490.724138 710231
Arizona 426134.466667 6392017
Arkansas 38878.906667 2915918
California 642309.586207 37253956
Colorado 78581.187500 5029196
它是否首先针对州名进行分组,然后在普查中进行汇总?如果是这样,那为什么groupby参数是人口普查