Question

您好我试图采取一个数据帧中重复的示例行的平均值。我可以生成两行中所有列的均值，但是那时我的某些列中包含文本-这导致很多NA。我该如何解决？

Answer 1

如果这些行确实是重复的（例如，所有值都相同），并且假设您有一个ID变量将这些重复的行分组，那么您只需为每个ID取第一行。

类似的事情可能会起作用：

library(dplyr)
new_data <- duplicated_data %>%
  group_by(ID) %>%
  slice(1) %>%
  ungroup()

duplicated_data是原始数据集，ID是用于确定样本是重复样本还是现在样本的ID变量。