我有两个数据帧A和B,在相同的变量ID上有40k和110k的观测值。我想创建C,它是A中的所有行,但不在B中,也不在交点处。尝试
pd.Series([1,2,3], index = pd.Index(['a','b','c'])
如果我使用左联接,我将有大约4万行,但正确的结果是大约200行。有提示吗?
答案 0 :(得分:1)
左联接的结果很好。左联接将为您提供左侧列表中的所有行(在您的情况下为A)以及右侧列表中具有匹配键的行(列表B)。这意味着将在左侧联接中选择A中的所有行。
也许subset可以解决您的问题