如何在两个相同的csv文件之间仅获取熊猫中的匹配列值

时间:2020-03-12 09:41:19

标签: python-3.x pandas csv

我有两个CSV文件,它们都有超过50000行,现在我只想查找两个CSV文件之间的匹配记录。 我尝试了很多类似的熊猫函数,并且所有记录的返回响应仅是truefalse

我如何只获取两个CSV之间的匹配列值?

 df2 = id externalcode
       1   00
       2   00




 df2 = id externalcode
        1   00
        2   00


任何帮助将不胜感激。我尝试过的代码如下:

data_frame1 = pd.read_csv("one.csv")
data_frame2 = pd.read_csv("two.csv")
print(type(data_frame1),type(data_frame2))
result = data_frame1[data_frame1['id'] == data_frame2['id']]
df1 = data_frame1['id'].isin(data_frame2['id'])
df2 = data_frame1['values_externalCode'].isin(data_frame2['values_externalCode'])

1 个答案:

答案 0 :(得分:0)

df1 = data_frame1[data_frame1['id'].isin(list(data_frame2['id']))]

我修改了您的尝试之一,如果有效,请告诉我! 因此,此代码将选择data_frame1中的ID,这些ID也将出现在data_frame2中。