寻找工作在50K以上的工人比例最高的国家

时间:2020-07-22 12:01:34

标签: python jupyter-notebook data-science data-analysis

需要计算哪个国家的收入超过5万的人口比例最高? 这是使用的数据集的预览 预期答案是伊朗,占41.9% 1994 census dataset 我的方法

country = df[df['income']==">50K"][['sex','native.country']] top = country.describe()                                                         top.loc['top','native.country']

1 个答案:

答案 0 :(得分:0)

假设您将数据集存储到名为new的变量中。

#converting your sex column into numerical values to calculate the population
gender={'male':1,'female':2}
new.sex=[gender[item] for item in new.sex]

#calculating your desired result

data=new.loc[new.income>50K,['sex','native.country']]
result=data.groupby('native.country')['sex'].sum()
print(result)

这将为您提供该国的名字,该国人口收入超过5万的人口最多。

然后,如果您仍然想找到人口百分比,则可以使用以下方法轻松实现:

total=data['sex'].sum()
list1=[]
for i in result:
    list1.append(i/total*100)
print(list1)

希望,您会从我的答案中找到帮助。

快乐编码:)