我有一行数据框。前5列是ID列,其余是数据:
0 1 865694 C T 0 0 0 0 0 0 ... 0 0 0 0 0 0 0 0 0 0
另一个有很多行的数据帧(这里有一个子集)。前三列是ID列,其余是数据。
0 G C 3 3 3 3 3 3 3 3 ... 3 3 3 1 3 3 3 3 3 3
1 T G 0 0 0 0 0 0 0 0 ... 0 0 0 0 0 0 0 0 0 0
2 G A 3 2 3 3 3 3 3 3 ... 3 3 2 1 1 1 2 0 3 3
3 A G 3 3 3 3 3 3 3 3 ... 3 3 3 1 3 3 3 3 3 3
4 C T 0 0 0 0 0 0 0 0 ... 0 0 0 0 0 0 0 0 0 0
5 G A 0 0 0 0 0 0 0 0 ... 0 0 0 0 0 0 0 0 0 0
6 A G 0 0 0 0 0 0 0 0 ... 0 0 0 0 0 0 0 0 0 0
7 C T 3 3 3 3 3 3 3 3 ... 3 3 3 1 3 3 3 3 3 3
8 G A 0 0 0 0 0 0 0 0 ... 0 0 0 0 0 0 0 0 0 0
9 C T 3 2 3 3 3 3 3 3 ... 3 3 2 0 1 1 2 0 3 3
10 G A 0 0 0 0 0 0 0 0 ... 0 0 0 0 0 0 0 0 0
在两个数据帧中,数据列的值可以是0,1,2或3。
我想比较第一个数据帧行和第二个数据帧中的每一行,计算每个组合的出现次数。例如。 0,0的数量,它是第一个数据帧的行中具有0的列数,以及第二个数据帧的行中的0。如果这可以实现,则可以应用于每一行。
我想要归还的是00,01,02,03,10,11,12,13,20,21,22,23,30,31,32,33的数量。这可能是列表或数据框的形式,更大的问题是比较行,因为我有~2500个数据列。