在具有公共字段的两个csv文件之间找到不常见的行

时间:2016-05-08 00:18:29

标签: python pandas

我有一个包含以下数据的csv文件

code
AAA
BBA
CCC

和另一个具有不同结构但共同列的csv文件:

code
AAA
BBA
CCF

我想找到第一个数据帧中不存在的代码。在这种情况下CCC。

我该怎么做?

1 个答案:

答案 0 :(得分:2)

由于您使用的是pandas标记,因此我假设您正在使用pandas解决方案。如果您已在两个不同的数据框中读取了两个CSV文件,那么假设第一个CSV在df_1中读取,第二个CSV在df_2中读取,则可以执行此操作:

>> df_1[~df_1['code'].isin(df_2['code'])][['code']]

>> set(df_1['code'].values.tolist()) - set(df_2['code'].values.tolist())

>> set(list(df_1['code'])) - set(list(df_2['code']))

我希望这有帮助!