我有一个大约7800行和3个变量的数据集。我的变量是:ID,ITEM_NUMBER和EFFECTIVE_DATE。
每个ID有多个ITEM_NUMBER,每个ITEM_NUMBER都有自己的EFFECTIVE_DATE。
我想创建一个名为ID_EFFECTIVE_DATE的新列,其中每行[使用R]都按ID包含最早的EFFECTIVE_DATE。
对于一个可重现的示例,这里是一些数据的一小部分。
提前谢谢!
dt = data.frame(ID = c('08-237361-02','08-237361-02','08-237361-02','08-108829-02','08-108829-02','08-108829-02','08-100111-03','08-100111-03','08-100111-03'),
ITEM_NUMBER = c(1,2,3,1,2,3,1,2,3),
EFFECTIVE_DATE = c('2017-04-25','2016-04-25','2015-04-25','2017-05-25','2015-05-25','2016-05-25','2017-03-25','2016-03-25','2015-03-25'))