Question

首先要识别，然后根据2列中行的相同值删除重复项。但需要注意的是，我要先根据其他专栏进行分组。请帮忙！

以下是示例数据：

 public static void main(String[] args) {
    String Function = "myMethod";
    Function();
    }

我希望能够首先看到哪些是重复项，以便在按{/ 1>分组时studentid subj topic lesson testtime responsetime 1 1 math add a timestamp1 45sec 2 1 math add a timestamp1 45sec 2 1 math add a timestamp2 30sec 2 1 math add a timestamp3 15sec 2 1 math add b timestamp1 0sec 2 1 math add b timestamp1 0sec 2 1 math add b timestamp1 45sec 2 1 math add b timestamp1 45sec中识别任何重复模式

['testtime','responsetime']

然后能够放弃它们。在使用groupby方法时，我无法找到有关如何检查然后删除重复项的任何文档。请帮忙！

Answer 1

你能做到吗

df.drop_duplicates().groupby(['studentid','subj','topic','lesson')

基于groupby基于多列识别/删除2列中的重复项

1 个答案: