Question

我有一个数据框，其中包含（除其他外）具有浓度的数字列和具有状态标志的因子列。此状态标志包含NA。

这是一个例子

df<-structure(list(conc = c(101.769, 1.734, 62.944, 92.697, 25.091, 27.377, 24.343, 55.084, 0.335, 23.280), status = structure(c(NA, NA, NA, NA, NA, NA, 2L, NA, 1L, NA), .Label = c("<LLOQ", "NR"), class = "factor")), .Names = c("conc", "status"), row.names = c(NA, -10L), class = "data.frame")

我想用一个字符串替换浓度列以获取标志列的某些值，或者将浓度值格式化为一定数量的有效数字。

当我尝试这个时

ifelse(df$status=="NR","NR",df$conc)

状态标志中的NA不会触发真或假条件（并返回NA） - 正如文档所暗示的那样。我可以循环遍历行，然后在每个行上使用IF，但这似乎效率低下。

我错过了什么吗？我试过as.character（df $ status）也不行。我的魔力必须降低......

Answer 1

使用%in%代替==：

ifelse(df$status %in% "NR","NR", df$conc)

两种方法的并排比较：

data.frame(df, ph = ifelse(df$status=="NR","NR",df$conc), mp = ifelse(df$status %in% "NR","NR",df$conc))

查看?match了解更多信息 - 我不确定我能否解释清楚。

Answer 2

您必须对NA进行明确测试，以便您可以使用：

ifelse(df$status=="NR" | is.na(df$status),"NR",df$conc) # gives you NR for NA

或

ifelse(df$status=="NR" & !is.na(df$status),"NR",df$conc) # gives you df$conc for NA

Answer 3

如何测试缺失：

ifelse(is.na(df$status), df$conc, as.character(df$status))

根据R中包含NA的另一个因子替换数据帧中的值

3 个答案: