使用dplyr :: mutate / mutate_if的多个条件的ifelse语句

时间:2018-06-02 05:55:52

标签: r dplyr data-manipulation

我想创建一个新变量,如果来自一组变量的任何变量11,则0使用dplyr::mutate }和基本any函数。

数据集:

df <- structure(list(ID = 1:2, METFORMIN = c(0L, 0L), SULPHONYLUREA = c(0L, 0L), MEGLITINIDE = c(0L, 0L), ACARBOSE = c(0L, 0L),
                     THIAZOLIDINEDIONE = c(0L, 0L), DPP4_INHIBITOR = c(0L, 0L), SGLT2_INHIBITOR = c(1L, 1L), GLP1_RA = c(0L, 0L)), 
                .Names = c("ID", "METFORMIN", "SULPHONYLUREA", "MEGLITINIDE", "ACARBOSE", "THIAZOLIDINEDIONE", "DPP4_INHIBITOR",
                           "SGLT2_INHIBITOR", "GLP1_RA"), class = "data.frame", row.names = c(NA, -2L))

数据结构:

 #  ID METFORMIN SULPHONYLUREA MEGLITINIDE ACARBOSE THIAZOLIDINEDIONE DPP4_INHIBITOR SGLT2_INHIBITOR GLP1_RA
 #  1          0             0           0        0                 0              0               1       0
 #  2          0             0           0        0                 0              0               1       0

所需的数据结构:

 #  ID METFORMIN SULPHONYLUREA MEGLITINIDE ACARBOSE THIAZOLIDINEDIONE DPP4_INHIBITOR SGLT2_INHIBITOR GLP1_RA ORALDM
 #  1          0             0           0        0                 0              0               1       0      1
 #  2          0             0           0        0                 0              0               1       0      1

代码1:

df %>% mutate(ORALDM = if_else(any(METFORMIN:GLP1_RA) == 1, 1, 0))

这不会产生所需的输出并产生错误:

  

警告消息:1:在METFORMIN中:GLP1_RA:数值表达式具有   2个元素:仅使用第一个2:在METFORMIN中:GLP1_RA:数值   表达式有2个元素:只使用第一个

代码2:

df %>% mutate_if(predicate(any(METFORMIN:GLP1_RA) == 1), 1)

这也会出错:

  

谓词错误(任何(METFORMIN:GLP1_RA)== 1):找不到   功能“谓词”

1 个答案:

答案 0 :(得分:3)

将我的评论提升为答案。用:

df %>% mutate(ORALDM = +(rowSums(.[2:9]) > 0))

或者(当你想使用变量名时):

df %>% mutate(ORALDM = +(rowSums(select(df, METFORMIN:GLP1_RA)) > 0))

你得到:

  ID METFORMIN SULPHONYLUREA MEGLITINIDE ACARBOSE THIAZOLIDINEDIONE DPP4_INHIBITOR SGLT2_INHIBITOR GLP1_RA ORALDM
1  1         0             0           0        0                 0              0               1       0      1
2  2         0             0           0        0                 0              0               1       0      1

使用实现了同样的想法:

library(data.table)
dt <- setDT(copy(df))

dt[, ORALDM := +(rowSums(.SD) > 0), .SDcols = METFORMIN:GLP1_RA][]

注意:您也可以使用+as.integer代替as.numeric