使用for和if基于数据框中的其他列添加列值

时间:2013-01-07 18:40:18

标签: r if-statement for-loop

我有一个这样的数据框:

     id        adit     diag1   diag2       
      2       3         4230    2234        
      3       5         3345    4456        
      4       6         4567    4467

我想使用下面的伪代码添加其他2列dse1dse2

if diag1 contains 4230 then dse1 = 1 else dse1 = 0

if diag2 contains 4567 then dse2 =1  else dse2 = 0

我用过这个:

for (i in 1 : nrow(dse)){
  for (j in 3: ncol(dse)){
     if dse[i,j] %in% ("4320"){dse$dse1 = 1}
        else{dse$dse1 = 0}
    if dse[i,j] %in% ("4567"){dse$dse2 = 1}
        else{dse$dse2 = 0} 
  }
}

但这些都行不通。

6 个答案:

答案 0 :(得分:23)

无需使用循环,只需使用ifelse,例如

dse = within(dse, {
    dse1 = ifelse(diag1 == 4230, 1, 0)
    dse2 = ifelse(diag2 == 4567, 1, 0)
 })

答案 1 :(得分:12)

不要使用if / else。按照以下方式进行矢量化:

dat$dse1 <- as.numeric(dat$diag1 == 4230)
dat$dse2 <- as.numeric(dat$diag2 == 4567)

答案 2 :(得分:5)

像这样:

dse$dse1<-0
dse$dse2<-0
dse$dse1[dse$diag1==4230]<-1
dse$dse2[dse$diag2==4567]<-1

请给自己一个好的R教程(例如this)并阅读所有关于索引向量的内容。

答案 3 :(得分:4)

您可以使用transform

transform(dse, dse1 = as.numeric(diag1 == 4230),
               dse2 = as.numeric(diag2 == 4567))

答案 4 :(得分:0)

你也可以使用:

  

ifelse():

uploadTask.on('state_changed',(snapshot)=>{

答案 5 :(得分:0)

使用tidyverse的解决方案:

x = data.frame(id = c(2, 3, 4), 
               adit=c(3, 5, 6), 
               diag1=c(4230, 3345, 4567), 
               diag2=c(2234, 4456, 4467))

x %>% mutate(dse1 = if_else(diag1 == 4230, 1, 0), 
             dse2 = if_else(diag2 == 4567, 1, 0))