R-根据条件填充基于另一个的数据框

时间:2020-05-31 19:24:40

标签: r

我在R上有一个新的数据集,该252在第1(ID)列上有很多重复的值。我制作了另一个具有唯一值(已经填充了这些值)的数据集,并且我想根据另一个数据集填充其余的列(基本上将所有在第1列中共享相同值的值相加)。

有基本的功能可以使我做到这一点吗?

感谢与问候

1 个答案:

答案 0 :(得分:0)

我们可以在aggregate中使用base R。假设第一列的列名称为“ ID”,所有其他列均为数字类,我们按“ ID”分组,并获得sum

中其余列的aggregate
aggregate(.~ ID, df1, sum, na.rm = TRUE)

或与dplyr

library(dplyr)
df1 %>%
  group_by(ID) %>%
  summarise_at(vars(-group_cols()), sum, na.rm = TRUE)

或带有across的新版本

df1 %>%
  group_by(ID) %>%
  summarise(across(-group_cols(), sum, na.rm = TRUE))