我在某些字段的数据框中有重复的观察结果;我想通过一个独特的因子来展平框架,并从这些重复的字段中获取现有值。有些字段为NUM
,其他字段为INT
这是我写的代码:
MyData %>%
group_by(courseUser) %>%
summarize(USER=last(courseUser), finalPercent = max(FINAL_PERCENT)) -> MyData
courseUser
是我想要分组的因素
每个courseUser
都具有FINAL_PERCENT
的相同值,因此,通过请求max,我希望对该观察的条目进行重复数据删除。
但似乎我只传递finalPercent
的SINGLE值。
源数据是多样的,并且正确地转换为int。