Question

我有一个名为my_df的数据框，其中包含以下信息：

Id_user Id_log Condition
123     a      day
124     a      day
125     a      night
126     b      day
127     b      day
130     c      night

我想创建一个新列，其值基于Id_log出现的次数。例如：

Id_user Id_log Condition Id_log_user
123     a      day       1
124     a      day       2
125     a      night     3
126     b      day       1
127     b      day       2
130     c      night     1

我尝试使用dplyr函数进行计数：

counts_id_log <-my_df％>％ group_by（id_log）％>％count（id_log）

counts_id_log如下：

id_log n
a      3
b      2
c      1

然后，我可以将id_log用作向量，然后根据id_log的值创建一个升序向量。例如：

x<- counts_id_log$n

基于x，我试图创建以下向量：

y<- c(1,2,3,1,2,1)

在tha之后，我可以将y向量添加到原始数据帧。我尝试了一些rep，但效果不佳。任何建议，将不胜感激。我希望这很清楚。

Answer 1

提供我正确的理解，您可以执行以下操作

x <- c(2,2,4,5,1,2,3,5)

unlist(sapply(x, function(x) 1:x))
# [1] 1 2 1 2 1 2 3 4 1 2 3 4 5 1 1 2 1 2 3 1 2 3 4 5

或避免使用明确的function

unlist(sapply(x, seq, from = 1))

identical(as.numeric(unlist(sapply(x, function(x) 1:x))), y)
#[1] TRUE

Answer 2

修改后

library(dplyr)
df%>%group_by(Id_log)%>%mutate(Id_log_user=row_number())

Answer 3

使用此自定义功能，它应该执行您想要的操作：

CountNumber <- function(x) ave(seq_along(x), x, FUN=seq_along) 
my_df$count <- CountNumber(my_df$Id_log)

我之前曾问过这个问题，有人给了我这个答案，但我找不到原始的信。

根据另一个向量的值创建一个升序向量

3 个答案: