Python:在2个数据框中找到唯一的值,并避免重复

时间:2018-09-17 14:47:32

标签: python pandas

我有两个数据框

df1 = [1, 2, 3, 4, 5]
df2 = [1, 2, 3, 7, 9]

我想只用[4,5]获得一个新的Df (我写了号码,但实际列表是两个电子邮件列表) 然后我将把DataFrame保存到CSV文件中

我该怎么办?

3 个答案:

答案 0 :(得分:2)

df1 = [1, 2, 3, 4, 5]
df2 = [1, 2, 3, 7, 9]
[x for x in df1 if x not in df2]

答案 1 :(得分:2)

好像它们是list,然后我们使用set

set(df1)-set(df2)
Out[398]: {4, 5}

答案 2 :(得分:0)

Diff pandas数据框:

import pandas as pd
df1 = pd.DataFrame([1, 2, 3, 4, 5])
df2 = pd.DataFrame([1, 2, 3, 7, 9])
df3 = df1.merge(df2, indicator=True, how='outer')
df3[merged['_merge'] == 'left_only']

合并大熊猫数据框:

df4 = pd.concat([df1, df2]).drop_duplicates(keep=False)