我有2个数据帧; dataframe main和dataframe mini,标题完全相同但值不同,但有一些重叠。如何在单个列中获取重复值(例如,列'名称')。
示例:
dataframe main
Name size length
foo 1 2
foo2 3 4
foo3 5 6
foo4 7 8
dataframe mini
Name size length
foox 60 70
foo3 3 4
fooy 50 60
foo4 7 8
psuedo代码:intersect(column='Name', of='dataframe mini', against='dataframe main')
建议:(foo3,foo4)
答案 0 :(得分:0)
您可以使用isin
来屏蔽另一个df中的行值:
In [52]:
main.loc[main['Name'].isin(mini['Name']), 'Name']
Out[52]:
2 foo3
3 foo4
Name: Name, dtype: object