我有一组分类变量编码为单热格式。 我试图做一些像相关矩阵,但计算每对变量的时间是" on"在一起(意思是每个案例的两个变量都是1) 我知道我可以通过将两个向量相乘然后对总数求和来计算(仅两个为1的时间将加到总和上) 但我无法想出一种制作最终矩阵的方法。 例如 我有这个数据集
A B C D E
1 1 0 1 0
0 1 0 0 1
0 0 1 1 1
0 0 1 0 1
0 0 0 0 1
我需要一个像这样的矩阵(对角线值并不重要)
A B C D E
A - 1 0 1 0
B 1 - 0 1 0
C 0 0 - 1 2
D 1 1 1 - 1
E 0 0 2 1 -
例如,请注意E-C为2,因为在2个阶段都是On(1)