我有一个与国家/地区的世界幸福数据相关的csv文件。在该数据文件中,根据一些特定标准计算与幸福有关的不同分数。我想根据这些标准(特征)找到最坏的国家和最好的国家。下面用笔记本图片给出了我的解决方案:
happiness_df = pd.read_csv('Datasets/happiness_2017.csv')
happiness_data_by_country = {}
for column in happiness_df.describe().columns:
if column != 'Rank':
max_val = happiness_df.describe().loc['max',column]
min_val = happiness_df.describe().loc['min',column]
country_with_max = happiness_df.loc[happiness_df[column]==max_val,'Country'].values[0]
country_with_min = happiness_df.loc[happiness_df[column]==min_val,'Country'].values[0]
happiness_data_by_country[column] = {
"worst" : country_with_min,
"best" : country_with_max
}
在大熊猫中还有更好的方法吗?
答案 0 :(得分:0)
是的,可以尝试获得最大值:
df.loc [df ['HappinessScore']。idxmax()]
并且至少:df.loc [df ['HappinessScore']。idxmin()]。