我有一个数据框,其中包含(除其他外)具有浓度的数字列和具有状态标志的因子列。此状态标志包含NA。
这是一个例子
df<-structure(list(conc = c(101.769, 1.734, 62.944, 92.697, 25.091, 27.377, 24.343, 55.084, 0.335, 23.280), status = structure(c(NA, NA, NA, NA, NA, NA, 2L, NA, 1L, NA), .Label = c("<LLOQ", "NR"), class = "factor")), .Names = c("conc", "status"), row.names = c(NA, -10L), class = "data.frame")
我想用一个字符串替换浓度列以获取标志列的某些值,或者将浓度值格式化为一定数量的有效数字。
当我尝试这个时
ifelse(df$status=="NR","NR",df$conc)
状态标志中的NA不会触发真或假条件(并返回NA) - 正如文档所暗示的那样。我可以循环遍历行,然后在每个行上使用IF,但这似乎效率低下。
我错过了什么吗?我试过as.character(df $ status)也不行。我的魔力必须降低......
答案 0 :(得分:5)
使用%in%
代替==
:
ifelse(df$status %in% "NR","NR", df$conc)
两种方法的并排比较:
data.frame(df, ph = ifelse(df$status=="NR","NR",df$conc), mp = ifelse(df$status %in% "NR","NR",df$conc))
查看?match
了解更多信息 - 我不确定我能否解释清楚。
答案 1 :(得分:3)
您必须对NA
进行明确测试,以便您可以使用:
ifelse(df$status=="NR" | is.na(df$status),"NR",df$conc) # gives you NR for NA
或
ifelse(df$status=="NR" & !is.na(df$status),"NR",df$conc) # gives you df$conc for NA
答案 2 :(得分:2)
如何测试缺失:
ifelse(is.na(df$status), df$conc, as.character(df$status))