我有以下数据框:
symbol, name
abc Jumping Jack
xyz Singing Sue
rth Fat Frog
然后我有另一个具有相同结构(符号+名称)的数据帧。我需要输出第一个数据帧中的所有符号,而不是第二个数据帧中的符号。
允许名称列不同。例如,我可以在两个数据帧中都有symbol = xyz
但名称不同。那样就好。我只是试图获得两个数据帧中都没有出现的symbols
。
我确信这可以使用pandas merge完成,然后输出没有合并的行,但我似乎无法做到正确。
答案 0 :(得分:2)
使用isin
并使用~
否定条件:
df[~df['symbol'].isin(df1['symbol'])]
这将返回符号'存在于你的第一个df而不是另一个df