与熊猫的python购物篮分析

时间:2017-06-21 20:26:05

标签: python pandas

我有一个包含交易数据的数据框。每行代表一个交易,列表示产品是否已从类别(类别为A-F)购买(一个=是,零=否)。现在我想计算每个类别中的交易对。我的数据框如下所示:

A  B  C  D  E  F  
1  1  0  0  0  0   
1  0  1  1  0  0 

输出应该是一个矩阵,用于计算数据帧中的每对类别,如下所示:

  A B C D E F
A 4 2 1 0 4 2
B 5 6 7 3 5 1
C 1 6 5 8 7 9
D ...
E ...
F ...

任何人都知道如何解决这个问题的解决方案?

非常感谢!

1 个答案:

答案 0 :(得分:3)

使用点积与其转置:

df.T.dot(df)
Out: 
   A  B  C  D  E  F
A  2  1  1  1  0  0
B  1  1  0  0  0  0
C  1  0  1  1  0  0
D  1  0  1  1  0  0
E  0  0  0  0  0  0
F  0  0  0  0  0  0

请注意,寻找成对出现次数并不可​​扩展。您可能希望查看apriori algorithm