我有一个数据框,显示唯一的" person.id"对于一个月中的每个日历日。我试图按日历日获取唯一身份证的累积计数。例如,附加图像的正确输出为:
日历日1-4(A,B,C,D)
日历日1:2--6(A,B,C,D,E,F)
日历日1:3-10(A,B,C,D,E,F,G,H,I,J)
完整数据集按月分组,因此理想情况下,累计唯一计数输出与组相关联(换句话说,当日历日变为1时,累计计数重置)。
我已尝试通过n_distinct(person.id)进行总结,但我无法弄清楚如何在第1天获得累积数据:n。
注意:我在dplyr中熟悉,但没有那么多data.table,如果可能的话,我希望在dplyr中有执行的想法......
谢谢!
答案 0 :(得分:0)
我相信这是你追求的目标吗?
{{1}}