我有一个如下数据框,它是由多个csv文件组成的,这些文件代表了多年追踪的机构:
title_iv.completed_by.4yrs title_iv.withdrawn_by.4yrs \
id school_year
100654 10_11 0.230342 0.233519
11_12 0.249322 0.224029
12_13 0.258167 0.227888
13_14 0.241846 0.225935
14_15 0.208396 0.256372
foo bar ownership
0.45 0.63 public
0.25 0.26 public
0.84 0.74 public
0.45 0.35 public
0.26 0.21 public
我希望每个唯一ID一次只考虑一年的图,以便我可以逐年直观地查看整个样本人口中列的变化。基本上类似于以下内容,但每个school_year
索引一个,每个id
仅使用一个观察值。 id
对应于由数据调查的唯一机构。
我该怎么做?
顺便说一下,id
和school_year
列都是数据框的索引。