如何比较两个数据帧并从Pandas中的数据帧中删除不匹配的行?

时间:2018-04-08 09:57:54

标签: python-3.x

我是python的新手(特别是熊猫)。

我有两个数据帧df1& DF2。 df1有200行。 df2有250行。索引值还包含重复项。

df1:
ProcessID
      248
      436
      500
      500

另一个数据框

ProcessID   Day      Time     Status
      248   Sun  23:26:51  completed
      436   Sat  01:50:56  completed
      500   Thu  14:18:21  completed
      500   Wed  23:00:15  Completed

我想知道如何根据processID(两个df中的索引)比较pandas中的两个数据帧。根据比较,我想删除df2中多余的行。

如果有人可以指导我,将会有很大帮助。

1 个答案:

答案 0 :(得分:1)

您可以从索引构建集合。并删除两个索引中的重复项

duplicates = set(df1.index).intersection(df2.index)
df2 = df2.drop(duplicates, axis=0)