基于R中的二进制代码定义虚拟变量

时间:2016-05-09 13:34:17

标签: r dummy-variable

从医院获取以下患者数据示例。

ENV['ember-simple-auth'] = {
  crossOriginWhiteList: ['http://10.10.1.7:3000'],
  routeAfterAuthentication: 'profile',
  //store: 'simple-auth-session-store:local-storage',
  //authorizer: 'simple-auth-authorizer:token',
};

我想介绍一个虚拟变量YEAR <- sample(1980:1995,15, replace=T) Pat_ID <- sample(1:100,15) sex <- c(1,0,1,0,1,0,0,1,0,0,0,0,1,0,0) df1 <- data.frame(Pat_ID,YEAR,sex) ,每次出现新$PAIR_IDENTIFIER时都会获取一个新值。问题是sex==1变量没有恒定的模式。

您有时会看到后续的sex出现在1位置,然后出现在ith+2位置等。

所以ith+3

1 个答案:

答案 0 :(得分:4)

您只需使用cumsum

即可
df1$PAIR_IDENTIFIER <- cumsum(df1$sex)
df1
#   Pat_ID YEAR sex PAIR_IDENTIFIER
#1      54 1991   1               1
#2     100 1992   0               1
#3       6 1995   1               2
#4      99 1994   0               2
#5      42 1988   1               3
#6      65 1990   0               3
#7      53 1994   0               3
#8      96 1987   1               4