数据:我在数据框中有数据,列标题为“subject_id”,“date”和“categorical_value1”。 Categorical_value1可能具有值A,B和C.每个主题ID都有多行,但它们不按任何特定顺序排序。
问题:我想创建一个数据子集,其中categorical_value1必须为= A,并且每个subject_id只选择最新(最近的)日期值。因此,每个subject_id最多只能有一个唯一行,但如果该id没有categorical_value1 = A,则可能没有给定subject_id的行。有关最经济的方法的建议吗?