我有一个名为my_df的数据框,其中包含以下信息:
Id_user Id_log Condition
123 a day
124 a day
125 a night
126 b day
127 b day
130 c night
我想创建一个新列,其值基于Id_log出现的次数。例如:
Id_user Id_log Condition Id_log_user
123 a day 1
124 a day 2
125 a night 3
126 b day 1
127 b day 2
130 c night 1
我尝试使用dplyr
函数进行计数:
counts_id_log <-my_df%>% group_by(id_log)%>%count(id_log)
counts_id_log如下:
id_log n
a 3
b 2
c 1
然后,我可以将id_log用作向量,然后根据id_log的值创建一个升序向量。例如:
x<- counts_id_log$n
基于x,我试图创建以下向量:
y<- c(1,2,3,1,2,1)
在tha之后,我可以将y向量添加到原始数据帧。
我尝试了一些rep
,但效果不佳。任何建议,将不胜感激。我希望这很清楚。
答案 0 :(得分:2)
提供我正确的理解,您可以执行以下操作
x <- c(2,2,4,5,1,2,3,5)
unlist(sapply(x, function(x) 1:x))
# [1] 1 2 1 2 1 2 3 4 1 2 3 4 5 1 1 2 1 2 3 1 2 3 4 5
或避免使用明确的function
unlist(sapply(x, seq, from = 1))
identical(as.numeric(unlist(sapply(x, function(x) 1:x))), y)
#[1] TRUE
答案 1 :(得分:0)
修改后
library(dplyr)
df%>%group_by(Id_log)%>%mutate(Id_log_user=row_number())
答案 2 :(得分:0)
使用此自定义功能,它应该执行您想要的操作:
CountNumber <- function(x) ave(seq_along(x), x, FUN=seq_along)
my_df$count <- CountNumber(my_df$Id_log)
我之前曾问过这个问题,有人给了我这个答案,但我找不到原始的信。