我有这样的数据集,
dat <- data.frame(d1=c(0,1,0,1,0),
d2=c(0,1,1,1,0),d3=c(1,0,1,1,0),
d4=c(1,0,0,0,0),d5=c(1,1,1,0,0))
dat
d1 d2 d3 d4 d5
1 0 0 1 1 1
2 1 1 0 0 1
3 0 1 1 0 1
4 1 1 1 0 0
5 0 0 0 0 0
如果我认为每一行都是为个人设定的。我想基于run计算一个名为“indicator”的指标变量。例如,对于此向后运行长度,单个1运行是(0,0,1,1,1),其中值1是3。另一方面,对于个别3运行是(0,1,1,0, 1),向后运行长度值为1,s为1.所需数据集如下。
d1 d2 d3 d4 d5 indicator
0 0 1 1 1 3
1 1 0 0 1 1
0 1 1 0 1 1
1 1 1 0 0 3
0 0 0 0 0 0
我试过这种方式,
indicator <- NULL
for(i in 1:5){
indicator[i] <- rev(sequence(rle(dat[i,])$lengths))[1]
}
indicator[1:5]
cbind(dat, indicator=indicator[1:5])
但是这会提供这样的数据,
d1 d2 d3 d4 d5 indicator
1 0 0 1 1 1 3
2 1 1 0 0 1 1
3 0 1 1 0 1 1
4 1 1 1 0 0 2
5 0 0 0 0 0 5
任何人都可以帮我解决这个问题吗?
答案 0 :(得分:5)
尝试
val <- apply(dat, 1, function(x) with(rle(rev(x)==1), lengths[values])[1])
dat$indicator <- replace(val, is.na(val),0)
dat
# d1 d2 d3 d4 d5 indicator
#1 0 0 1 1 1 3
#2 1 1 0 0 1 1
#3 0 1 1 0 1 1
#4 1 1 1 0 0 3
#5 0 0 0 0 0 0
答案 1 :(得分:1)
另一种方法:
x = apply(rev(dat),1, function(u) ifelse(u[1]==1, match(0,u)-1, match(1,u)))
transform(dat, indicator = ifelse(is.na(x), 0,x))
# d1 d2 d3 d4 d5 indicator
#1 0 0 1 1 1 3
#2 1 1 0 0 1 1
#3 0 1 1 0 1 1
#4 1 1 1 0 0 3
#5 0 0 0 0 0 0