大家好, 你能帮我解决这个问题吗,
我的数据集中包含功能ID和客户群(A,B,C,D),数据集中有重复的ID。
我想按ID进行分组,并用模式替换分类数据。我已经写了相同的代码 -
library(dplyr)
Aug_Pay = read.csv("/home/hduser/Desktop/Aug_pay.csv")
#Number of Duplicate id in rows
dup <- Aug_Pay[duplicated(Aug_Pay, by = "id")]
#Number of Unique rows
Unique_Rows <- unique(Aug_Pay, by = "id")
### mode function
getmode <- function(v) {
uniqv <- unique(v)
uniqv[which.max(tabulate(match(v, uniqv)))]
}
by_id <- group_by(Aug_Pay, id)
new_frame <- by_id %>% summarise(VAR_2 = getmode(Aug_Pay$cust_value_seg),
n = n())
通过执行上述代码,整个列将被模式替换。相反,我希望重复ID应按ID分组,相应的分类数据应替换为模式。
此致 CHANDAN