Panads groupby并将某些列保存为CSV

时间:2018-04-04 17:00:07

标签: python pandas

我正在阅读包含Employer,City,State,Zipcode和Jobtitle栏目的CSV到pandas的CSV。

要求是按雇主+城市分组,计算结果并将四列(雇主,城市,邮政编码和计数)写入CSV。

这是我到目前为止所做的,

data = pd.read_csv("jobs.csv")
data.groupby(["Employer", "City"]).count()

这给了我:

Employer    City       State    Zipcode   Jobtitle 
Emp1      Cincinnati     1        1          1   
Emp2      Delaware      14        0         14   
Emp3      Akron          1        0          1 

我想要的是:

Employer    City       Zipcode    Jobcount
Emp1      Cincinnati    12345         1  
Emp2      Delaware      22112        14  
Emp3      Akron         34567         1 

其中 Jobcount 显示雇主+城市组合的工作数。

1 个答案:

答案 0 :(得分:1)

如果您希望每位员工/城市拥有1个邮政编码,则可以执行以下操作:

data.groupby(['Employer', 'City', 'Zipcode']).agg({'Jobtitle': 'size'})
data.columns = ['Employer', 'City', 'Zipcode', 'Jobcount']