所以我遇到了一个编程问题,我发现它有点挑战性。我在买家和卖家ala上有几年的每日数据(位于Pandas DataFrame)。这样:
Seller Buyer Amount
2012/11/13 Bank1 Bank2 15
2012/11/13 Bank1 Bank2 17
2012/11/13 Bank5 Bank3 5
2012/11/14 Bank4 Bank2 10
2012/11/14 Bank1 Bank3 22
索引是Pandas.DatetimeIndex。
我想在每个月的基础上计算每个购买银行的每月总交易量中有多少来自每个卖家,他们已与之互动。所以在上面的例子中,输出(最好是DataFrame)也是:
Month Seller Buyer Share
2012/11 Bank1 Bank2 32/42
2012/11 Bank4 Bank2 10/42
2012/11 Bank5 Bank3 5/27
2012/11 Bank1 Bank3 22/27
非常感谢任何输入!
答案 0 :(得分:0)
我已经向Github上传了一个IPython笔记本,应该开始回答你的问题了。你可以找到它here。
这里的基本方法是进行DataFrame.groupby()
操作。使用您提供的虚拟数据,我首先执行data.groupby('Buyer').sum()
,将索引重置为买方,将总和添加为“总计”列,最后除以。
我不太确定如何处理时间序列的东西(即按月分组时,只有完整日期信息未分成年月日期)。如果其他人有建议,请发表评论,以便我可以更新笔记本和我的答案!