我将以下数据框索引如下:
census_df = pd.read_csv('census.csv')
columns_to_keep=['STATE','COUNTY','STNAME','CTYNAME']
census_df=census_df[census_df['SUMLEV']==50]
df=census_df[columns_to_keep]
df = df.set_index(['STNAME','CTYNAME'])
df.head()
看起来像这样
其中“STNAME”是州名,“CITYNAME”是县名。每个州和县都有一个特定的代码,显示在“STATE”和“COUNTY”列中。
我需要返回具有最大县的州的名称。到目前为止,我做过类似的事情
df.groupby('STATE').count()
num_state= g['COUNTY'].argmax()
state_name = df[df['STATE']==num_state].index[0][0]
但我确信必须有一种更简单的方法来计算多索引数据帧中的行。
由于