我是python的新手(特别是熊猫)。
我有两个数据帧df1& DF2。 df1有200行。 df2有250行。索引值还包含重复项。
df1:
ProcessID
248
436
500
500
另一个数据框
ProcessID Day Time Status
248 Sun 23:26:51 completed
436 Sat 01:50:56 completed
500 Thu 14:18:21 completed
500 Wed 23:00:15 Completed
我想知道如何根据processID(两个df中的索引)比较pandas中的两个数据帧。根据比较,我想删除df2中多余的行。
如果有人可以指导我,将会有很大帮助。
答案 0 :(得分:1)
您可以从索引构建集合。并删除两个索引中的重复项
duplicates = set(df1.index).intersection(df2.index)
df2 = df2.drop(duplicates, axis=0)