需要计算哪个国家的收入超过5万的人口比例最高? 这是使用的数据集的预览 预期答案是伊朗,占41.9% 1994 census dataset 我的方法
country = df[df['income']==">50K"][['sex','native.country']] top = country.describe() top.loc['top','native.country']
答案 0 :(得分:0)
假设您将数据集存储到名为new的变量中。
#converting your sex column into numerical values to calculate the population
gender={'male':1,'female':2}
new.sex=[gender[item] for item in new.sex]
#calculating your desired result
data=new.loc[new.income>50K,['sex','native.country']]
result=data.groupby('native.country')['sex'].sum()
print(result)
这将为您提供该国的名字,该国人口收入超过5万的人口最多。
然后,如果您仍然想找到人口百分比,则可以使用以下方法轻松实现:
total=data['sex'].sum()
list1=[]
for i in result:
list1.append(i/total*100)
print(list1)
希望,您会从我的答案中找到帮助。
快乐编码:)