基于另一个向量内的数据块分配二进制向量

时间:2017-08-02 14:58:01

标签: r for-loop if-statement dataframe data.table

我有一个数据框:

dat <- data.frame(diffsecs=(c(189, 245, 13988, 2396, 29601, 263, 297, 292, 230, 257, 192, 
    286, 236, 261, 286, 268, 294, 260, 286, 299, 514, 2287, 234, 
    195, 250, 519, 560, 3314, 12340, 186, 184, 180, 180, 180, 180, 
    180, 180, 180, 180, 180, 3072, 180, 180, 206, 180, 180, 180, 
    360, 180, 180, 180, 180, 5220, 180, 437, 246, 218, 212, 472, 
    2356, 2641, 363, 425, 757, 403, 181, 355, 192, 192, 784, 238, 
    250, 261, 272, 2554, 29524, 4482, 6762, 1252, 269, 303, 294, 
    286, 273, 289, 274, 216, 255, 180, 252, 322, 238, 583, 289, 317, 
    308, 305, 308, 312, 330)))

它有多个实例块,其中有多个连续的行等于180.我想分配一个二进制向量,当diffsecs的值等于180时,它等于1,否则为0。但是,我只希望它在一个包含5个或更多180个连续实例的块中等于1.因此,如果有3个连续值为180,则二进制向量将等于0.

我尝试使用循环

total<- nrow(dat)
len<- 1:total

for(i in len){
  temp<- dat[i:(i+5),] 
  xdiff<- ifelse(mean(temp$diffsecs)>178 & mean(temp$diffsecs)<182 ,1,0)
  temp2<- cbind(dat[i,],xdiff)
  if(i==1) {dat2 <- temp2}
  else {dat2<- rbind(dat2,temp2)}

}

但它没有管理它并分配比所需更短的块。

2 个答案:

答案 0 :(得分:4)

你可以利用伟大的rle函数,它是反向的:

RLE <- rle(dat$diffsecs)
RLE$values <- ifelse(RLE$values == 180 & RLE$lengths >= 5,1,0)
dat2 <- cbind(dat,binarycol=inverse.rle(RLE))

正如@Frank正确指出的那样,您可以将第二行缩短为:

RLE$values <- as.integer(RLE$values == 180 & RLE$lengths >= 5)

甚至:

RLE$values <- RLE$values == 180 & RLE$lengths >= 5

如果FALSE/TRUE的向量适合您而不是0/1

答案 1 :(得分:2)

使用data.table,您可以使用TableViewFillModelInterfance

TableViewFillModelInterfance<T> item = new TableViewFillModelInterfance<T>();
item.getName(); 
 <------------------------------------------------->

TableViewCustomer item = new TableViewCustomer();
item.getItem(); //Its not what i want to!