我有以下问题,我找不到任何简单的解决方案。
我想在向量中找到非零元素组(由至少一个零分隔)并为每个组分配一个id(后续整数)。例如,在向量value <- c(1,1,2,3,4,3,0,0,0,1,2,3,9,8,0,0,3,2)
中应该有三组:[1,1,2,3,4,3],[1,2,3,9,8],[3,2],所以我我想获得这样一个数据框:
value id
1 1 1
2 1 1
3 2 1
4 3 1
5 4 1
6 3 1
7 0 NA
8 0 NA
9 0 NA
10 1 2
11 2 2
12 3 2
13 9 2
14 8 2
15 0 NA
16 0 NA
17 3 3
18 2 3
答案 0 :(得分:11)
您可以尝试:
as.integer(factor(cumsum(value==0)*NA^(value==0)))
#[1] 1 1 1 1 1 1 NA NA NA 2 2 2 2 2 NA NA 3 3
答案 1 :(得分:6)
使用rle()
。首先创建一个用NA替换零的新向量。
x <- match(value != 0, TRUE)
with(rle(!is.na(x)), {
lv <- lengths[values]
replace(x, !is.na(x), rep(seq_along(lv), lv))
})
# [1] 1 1 1 1 1 1 NA NA NA 2 2 2 2 2 NA NA 3 3
答案 2 :(得分:1)
你也可以这样做:
id <- (value>0)^NA
x <- rle(value>0)$lengths[c(TRUE, FALSE)]
id[!is.na(id)] <- rep(seq_along(x), times=x)
#[1] 1 1 1 1 1 1 NA NA NA 2 2 2 2 2 NA NA 3 3
答案 3 :(得分:1)
另一种可能性:
ifelse(value != 0,
cumsum(value != 0 & dplyr::lag(value) %in% c(0, NA)),
NA)
# [1] 1 1 1 1 1 1 NA NA NA 2 2 2 2 2 NA NA 3 3
答案 4 :(得分:-2)
我希望这个答案有所帮助。