我有一个包含交易数据的数据框。每行代表一个交易,列表示产品是否已从类别(类别为A-F)购买(一个=是,零=否)。现在我想计算每个类别中的交易对。我的数据框如下所示:
A B C D E F
1 1 0 0 0 0
1 0 1 1 0 0
输出应该是一个矩阵,用于计算数据帧中的每对类别,如下所示:
A B C D E F
A 4 2 1 0 4 2
B 5 6 7 3 5 1
C 1 6 5 8 7 9
D ...
E ...
F ...
任何人都知道如何解决这个问题的解决方案?
非常感谢!
答案 0 :(得分:3)
使用点积与其转置:
df.T.dot(df)
Out:
A B C D E F
A 2 1 1 1 0 0
B 1 1 0 0 0 0
C 1 0 1 1 0 0
D 1 0 1 1 0 0
E 0 0 0 0 0 0
F 0 0 0 0 0 0
请注意,寻找成对出现次数并不可扩展。您可能希望查看apriori algorithm。