首先要识别,然后根据2列中行的相同值删除重复项。但需要注意的是,我要先根据其他专栏进行分组。请帮忙!
以下是示例数据:
public static void main(String[] args) {
String Function = "myMethod";
Function();
}
我希望能够首先看到哪些是重复项,以便在按{/ 1>分组时 studentid subj topic lesson testtime responsetime
1 1 math add a timestamp1 45sec
2 1 math add a timestamp1 45sec
2 1 math add a timestamp2 30sec
2 1 math add a timestamp3 15sec
2 1 math add b timestamp1 0sec
2 1 math add b timestamp1 0sec
2 1 math add b timestamp1 45sec
2 1 math add b timestamp1 45sec
中识别任何重复模式
['testtime','responsetime']
然后能够放弃它们。 在使用groupby方法时,我无法找到有关如何检查然后删除重复项的任何文档。请帮忙!
答案 0 :(得分:0)
你能做到吗
df.drop_duplicates().groupby(['studentid','subj','topic','lesson')