根据R中包含NA的另一个因子替换数据帧中的值

时间:2010-03-31 13:07:38

标签: r dataframe

我有一个数据框,其中包含(除其他外)具有浓度的数字列和具有状态标志的因子列。此状态标志包含NA。

这是一个例子

df<-structure(list(conc = c(101.769, 1.734, 62.944, 92.697, 25.091, 27.377, 24.343, 55.084, 0.335, 23.280), status = structure(c(NA, NA, NA, NA, NA, NA, 2L, NA, 1L, NA), .Label = c("<LLOQ", "NR"), class = "factor")), .Names = c("conc", "status"), row.names = c(NA, -10L), class = "data.frame")

我想用一个字符串替换浓度列以获取标志列的某些值,或者将浓度值格式化为一定数量的有效数字。

当我尝试这个时

ifelse(df$status=="NR","NR",df$conc)

状态标志中的NA不会触发真或假条件(并返回NA) - 正如文档所暗示的那样。我可以循环遍历行,然后在每个行上使用IF,但这似乎效率低下。

我错过了什么吗?我试过as.character(df $ status)也不行。我的魔力必须降低......

3 个答案:

答案 0 :(得分:5)

使用%in%代替==

ifelse(df$status %in% "NR","NR", df$conc)

两种方法的并排比较:

data.frame(df, ph = ifelse(df$status=="NR","NR",df$conc), mp = ifelse(df$status %in% "NR","NR",df$conc))

查看?match了解更多信息 - 我不确定我能否解释清楚。

答案 1 :(得分:3)

您必须对NA进行明确测试,以便您可以使用:

ifelse(df$status=="NR" | is.na(df$status),"NR",df$conc) # gives you NR for NA

ifelse(df$status=="NR" & !is.na(df$status),"NR",df$conc) # gives you df$conc for NA

答案 2 :(得分:2)

如何测试缺失:

ifelse(is.na(df$status), df$conc, as.character(df$status))