Python熊猫按邮政编码堆叠,并按月/年分组

时间:2018-12-03 12:38:44

标签: python-3.x pandas group-by time-series zipcode

我有一个包含交易数据的大数据框。我想做的是使用python汇总从邮政编码开始的数据,然后是年份和月份,最后是该月的交易总数。

我的女友:

  Date        VAR1   VAR2    ZipCode    Transactions
YYYY-MM-DD.    X.     Y.     12345.         1.      

所以我要做的第一件事就是将日期时间转换为日期时间

 df['Date'] = pd.to_datetime(df['Date'])
 df.info()
 # Date datetime64[ns]

然后我将数据分为年份-月份和交易次数:

# grouping the data by year and month
per = df.Date.dt.to_period("M")  
g = df.groupby(per)
g.sum() # so now that this works, we need to break it up into zip codes

哪个输出为:

Date.       Transactions
YYYY-MM.        X
YYYY-MM.        Y

我的问题是,我最想知道的邮政编码是什么?

ZipCode.     Date.    Transactions
 123345.   YYYY-MM.     sum()

非常感谢所有帮助

1 个答案:

答案 0 :(得分:1)

我认为,如果需要按邮政编码和按月分组,则需要将列ZipCode添加到groupby

per = df.Date.dt.to_period("M")
df1 = df.groupby(['ZipCode',per])['Transactions'].sum().reset_index()