基于groupby基于多列识别/删除2列中的重复项

时间:2018-03-05 21:54:48

标签: python pandas dataframe group-by duplicates

首先要识别,然后根据2列中行的相同值删除重复项。但需要注意的是,我要先根据其他专栏进行分组。请帮忙!

以下是示例数据:

 public static void main(String[] args) {
    String Function = "myMethod";
    Function();
    }

我希望能够首先看到哪些是重复项,以便在按{/ 1>分组时 studentid subj topic lesson testtime responsetime 1 1 math add a timestamp1 45sec 2 1 math add a timestamp1 45sec 2 1 math add a timestamp2 30sec 2 1 math add a timestamp3 15sec 2 1 math add b timestamp1 0sec 2 1 math add b timestamp1 0sec 2 1 math add b timestamp1 45sec 2 1 math add b timestamp1 45sec 中识别任何重复模式

['testtime','responsetime']

然后能够放弃它们。 在使用groupby方法时,我无法找到有关如何检查然后删除重复项的任何文档。请帮忙!

1 个答案:

答案 0 :(得分:0)

你能做到吗

df.drop_duplicates().groupby(['studentid','subj','topic','lesson')