熊猫:如何跟踪两个数据框之间匹配数据条目的索引?

时间:2018-12-17 01:45:12

标签: python pandas

我还是熊猫的新手。

我正在尝试 python字典的形式在两个熊猫数据帧之间缓存匹配数据条目的索引,以获取更多信息节省时间的计算和哈希查找。

例如,我有两个数据帧关系。

R1:                     R2:

A        B              B        C
1        2              2        18
2        2              5        18
3        6              6        26
4        7              6        31
                        7        32

列B是R1和R2之间的公共属性。我想构建一个字典,将R1中的每个值映射到R2中匹配的数据条目的索引。

例如期望的输出

{2: [0],        (2 from R1[B] matches with the 0th entry in R2)
 6: [2,3]       (6 from R1[B] matches with the 2nd and 3rd entry in R2)
 7: [4]}        (7 from R1[B] matches with the 4th entry in R2)

有没有一种有效的方法? R1 [B]中与R2中不匹配的值是否显示为在输出字典中具有空列表作为值的项目,还是被完全跳过。

谢谢!

1 个答案:

答案 0 :(得分:1)

reset_indexgroupby与R2列B一起使用,得到list的{​​{1}},然后与index链接

.loc