Question

我正在阅读包含Employer，City，State，Zipcode和Jobtitle栏目的CSV到pandas的CSV。

要求是按雇主+城市分组，计算结果并将四列（雇主，城市，邮政编码和计数）写入CSV。

这是我到目前为止所做的，

data = pd.read_csv("jobs.csv")
data.groupby(["Employer", "City"]).count()

这给了我：

Employer    City       State    Zipcode   Jobtitle 
Emp1      Cincinnati     1        1          1   
Emp2      Delaware      14        0         14   
Emp3      Akron          1        0          1

我想要的是：

Employer    City       Zipcode    Jobcount
Emp1      Cincinnati    12345         1  
Emp2      Delaware      22112        14  
Emp3      Akron         34567         1

其中 Jobcount 显示雇主+城市组合的工作数。

Answer 1

如果您希望每位员工/城市拥有1个邮政编码，则可以执行以下操作：

data.groupby(['Employer', 'City', 'Zipcode']).agg({'Jobtitle': 'size'})
data.columns = ['Employer', 'City', 'Zipcode', 'Jobcount']

Panads groupby并将某些列保存为CSV

1 个答案: