我使用的是salaries.csv数据集,您找到https://www.kaggle.com/kaggle/sf-salaries/data 我试图找到有500多个数据点的职位。之后计算每个职位的平均TotalPayBenefits。输出是打印前10名收入职位。
我做了什么,
salaries = pd.read_csv('Salaries.csv')
salaries = salaries.drop(["Id", "Notes", "Status", "Agency"], axis = 1)
salaries = salaries.dropna()
salaries.head()
jobtitlelist = (salaries.JobTitle.value_counts()>500)[0:10]
data_10jobtitle = salaries[salaries.JobTitle.isin(jobtitlelist.index)]
avgsalary_10jobtitle = data_10jobtitle.groupby(by=data_10jobtitle.JobTitle).TotalPayBenefits.mean()
print(avgsalary_10jobtitle)
我想我会想念我找不到确切输出的小东西。
答案 0 :(得分:0)
您需要更改此行
jobtitlelist = salaries.JobTitle.value_counts()[(salaries.JobTitle.value_counts()>500)][0:10]
答案 1 :(得分:0)
在这一行:
jobtitlelist = (salaries.JobTitle.value_counts()>500)[0:10]
您首先找到至少有500条记录的工作,然后您将获得前10个工作,这些工作用于计算平均总工资福利。所以你的工作流程是
但根据您的问题,您的工作流程应为