我有一个包含以下数据的csv文件
code
AAA
BBA
CCC
和另一个具有不同结构但共同列的csv文件:
code
AAA
BBA
CCF
我想找到第一个数据帧中不存在的代码。在这种情况下CCC。
我该怎么做?
答案 0 :(得分:2)
由于您使用的是pandas
标记,因此我假设您正在使用pandas
解决方案。如果您已在两个不同的数据框中读取了两个CSV文件,那么假设第一个CSV在df_1
中读取,第二个CSV在df_2
中读取,则可以执行此操作:
>> df_1[~df_1['code'].isin(df_2['code'])][['code']]
或
>> set(df_1['code'].values.tolist()) - set(df_2['code'].values.tolist())
或
>> set(list(df_1['code'])) - set(list(df_2['code']))
我希望这有帮助!