我还是熊猫的新手。
我正在尝试以 python字典的形式在两个熊猫数据帧之间缓存匹配数据条目的索引,以获取更多信息节省时间的计算和哈希查找。
例如,我有两个数据帧关系。
R1: R2:
A B B C
1 2 2 18
2 2 5 18
3 6 6 26
4 7 6 31
7 32
列B是R1和R2之间的公共属性。我想构建一个字典,将R1中的每个值映射到R2中匹配的数据条目的索引。
例如期望的输出
{2: [0], (2 from R1[B] matches with the 0th entry in R2)
6: [2,3] (6 from R1[B] matches with the 2nd and 3rd entry in R2)
7: [4]} (7 from R1[B] matches with the 4th entry in R2)
有没有一种有效的方法? R1 [B]中与R2中不匹配的值是否显示为在输出字典中具有空列表作为值的项目,还是被完全跳过。
谢谢!
答案 0 :(得分:1)
将reset_index
和groupby
与R2列B一起使用,得到list
的{{1}},然后与index
链接
.loc