Question

我还是熊猫的新手。

我正在尝试以 python字典的形式在两个熊猫数据帧之间缓存匹配数据条目的索引，以获取更多信息节省时间的计算和哈希查找。

例如，我有两个数据帧关系。

R1: R2: A B B C 1 2 2 18 2 2 5 18 3 6 6 26 4 7 6 31 7 32

列B是R1和R2之间的公共属性。我想构建一个字典，将R1中的每个值映射到R2中匹配的数据条目的索引。

例如期望的输出

{2: [0], (2 from R1[B] matches with the 0th entry in R2) 6: [2,3] (6 from R1[B] matches with the 2nd and 3rd entry in R2) 7: [4]} (7 from R1[B] matches with the 4th entry in R2)

有没有一种有效的方法？ R1 [B]中与R2中不匹配的值是否显示为在输出字典中具有空列表作为值的项目，还是被完全跳过。

谢谢！

Answer 1

将reset_index和groupby与R2列B一起使用，得到list的{{1}}，然后与index链接

.loc

熊猫：如何跟踪两个数据框之间匹配数据条目的索引？

1 个答案: