pandas:比较数据帧行和存储值

时间:2018-04-14 22:48:22

标签: python pandas dataframe

我有一行数据框。前5列是ID列,其余是数据:

0   1   865694  C   T   0   0   0   0   0   0   ...     0   0   0   0   0   0   0   0   0   0

另一个有很多行的数据帧(这里有一个子集)。前三列是ID列,其余是数据。

0   G   C   3   3   3   3   3   3   3   3   ...     3   3   3   1   3   3   3   3   3   3
1   T   G   0   0   0   0   0   0   0   0   ...     0   0   0   0   0   0   0   0   0   0
2   G   A   3   2   3   3   3   3   3   3   ...     3   3   2   1   1   1   2   0   3   3
3   A   G   3   3   3   3   3   3   3   3   ...     3   3   3   1   3   3   3   3   3   3
4   C   T   0   0   0   0   0   0   0   0   ...     0   0   0   0   0   0   0   0   0   0
5   G   A   0   0   0   0   0   0   0   0   ...     0   0   0   0   0   0   0   0   0   0
6   A   G   0   0   0   0   0   0   0   0   ...     0   0   0   0   0   0   0   0   0   0
7   C   T   3   3   3   3   3   3   3   3   ...     3   3   3   1   3   3   3   3   3   3
8   G   A   0   0   0   0   0   0   0   0   ...     0   0   0   0   0   0   0   0   0   0
9   C   T   3   2   3   3   3   3   3   3   ...     3   3   2   0   1   1   2   0   3   3
10  G   A   0   0   0   0   0   0   0   0   ...     0   0   0   0   0   0   0   0   0   

在两个数据帧中,数据列的值可以是0,1,2或3。

我想比较第一个数据帧行和第二个数据帧中的每一行,计算每个组合的出现次数。例如。 0,0的数量,它是第一个数据帧的行中具有0的列数,以及第二个数据帧的行中的0。如果这可以实现,则可以应用于每一行。

我想要归还的是00,01,02,03,10,11,12,13,20,21,22,23,30,31,32,33的数量。这可能是列表或数据框的形式,更大的问题是比较行,因为我有~2500个数据列。

0 个答案:

没有答案