计算多索引数据帧pandas下的行

时间:2017-02-06 21:54:20

标签: python pandas indexing

我将以下数据框索引如下:

census_df = pd.read_csv('census.csv')
columns_to_keep=['STATE','COUNTY','STNAME','CTYNAME']
census_df=census_df[census_df['SUMLEV']==50]
df=census_df[columns_to_keep]
df = df.set_index(['STNAME','CTYNAME'])
df.head()

看起来像这样

enter image description here

其中“STNAME”是州名,“CITYNAME”是县名。每个州和县都有一个特定的代码,显示在“STATE”和“COUNTY”列中。

我需要返回具有最大县的州的名称。到目前为止,我做过类似的事情

df.groupby('STATE').count()
num_state= g['COUNTY'].argmax()
state_name = df[df['STATE']==num_state].index[0][0]

但我确信必须有一种更简单的方法来计算多索引数据帧中的行。

由于

0 个答案:

没有答案