您好我试图采取一个数据帧中重复的示例行的平均值。我可以生成两行中所有列的均值,但是那时我的某些列中包含文本-这导致很多NA。我该如何解决?
答案 0 :(得分:0)
如果这些行确实是重复的(例如,所有值都相同),并且假设您有一个ID变量将这些重复的行分组,那么您只需为每个ID取第一行。
类似的事情可能会起作用:
library(dplyr)
new_data <- duplicated_data %>%
group_by(ID) %>%
slice(1) %>%
ungroup()
duplicated_data
是原始数据集,ID
是用于确定样本是重复样本还是现在样本的ID变量。