我正在阅读包含Employer,City,State,Zipcode和Jobtitle栏目的CSV到pandas的CSV。
要求是按雇主+城市分组,计算结果并将四列(雇主,城市,邮政编码和计数)写入CSV。
这是我到目前为止所做的,
data = pd.read_csv("jobs.csv")
data.groupby(["Employer", "City"]).count()
这给了我:
Employer City State Zipcode Jobtitle
Emp1 Cincinnati 1 1 1
Emp2 Delaware 14 0 14
Emp3 Akron 1 0 1
我想要的是:
Employer City Zipcode Jobcount
Emp1 Cincinnati 12345 1
Emp2 Delaware 22112 14
Emp3 Akron 34567 1
其中 Jobcount 显示雇主+城市组合的工作数。
答案 0 :(得分:1)
如果您希望每位员工/城市拥有1个邮政编码,则可以执行以下操作:
data.groupby(['Employer', 'City', 'Zipcode']).agg({'Jobtitle': 'size'})
data.columns = ['Employer', 'City', 'Zipcode', 'Jobcount']