我有一个超过30列和100行的数据框。每行都是一个参与者,但有些参与者来自同一所学校,因此对于共享学校的给定参与者,某些列是相同的:
part_ID school_ID age gender sts_school courses_school
1 1 12 F 2967 21
2 1 11 F 2967 21
3 1 12 F 2967 21
4 2 12 F 1450 16
5 2 11 M 1450 16
6 3 12 F 2967 21
我想对数据进行子集化,这样每所学校我只能保留一行。也就是说,在上面的6行中,我只想保留3行,每个不同的school_ID一个。我保留/放弃的行无关紧要,因为与学校相关的所有信息都是相同的。
有输入吗?