R取数据集中重复行的平均值,当其中一些列文本

时间:2019-01-31 16:01:37

标签: r

您好我试图采取一个数据帧中重复的示例行的平均值。我可以生成两行中所有列的均值,但是那时我的某些列中包含文本-这导致很多NA。我该如何解决?

1 个答案:

答案 0 :(得分:0)

如果这些行确实是重复的(例如,所有值都相同),并且假设您有一个ID变量将这些重复的行分组,那么您只需为每个ID取第一行。

类似的事情可能会起作用:

library(dplyr)
new_data <- duplicated_data %>%
  group_by(ID) %>%
  slice(1) %>%
  ungroup()

duplicated_data是原始数据集,ID是用于确定样本是重复样本还是现在样本的ID变量。