假设这样的data.frame:
df <- read.table(text = "ID Date Condition
1 2015/01/01 Yes
1 2015/01/10 No
1 2015/01/15 Yes
2 2015/02/10 No
2 2015/03/08 No
3 2015/01/01 No
3 2015/04/01 Yes
3 2015/04/10 No
3 2015/04/01 Yes
3 2015/04/10 No", header = TRUE)
我想分别计算每个ID在给定日期和第一个日期之间的天数。现在,对于条件始终为“否”的每个ID,我想在结果栏中分配NA。
这是我的代码:
df %>%
mutate(Date = as.Date(Date, "%Y/%m/%d")) %>%
group_by(ID) %>%
mutate(Temp = Date - first(Date),
Res1 = ifelse(all(Condition == "No"), NA, Temp),
Res2 = if(all(Condition == "No")) NA else Temp)
结果:
ID Date Condition Temp Res1 Res2
<int> <date> <fct> <time> <dbl> <time>
1 1 2015-01-01 Yes 0 0. 0
2 1 2015-01-10 No 9 0. 9
3 1 2015-01-15 Yes 14 0. 14
4 2 2015-02-10 No 0 NA <NA>
5 2 2015-03-08 No 26 NA <NA>
6 3 2015-01-01 No 0 0. 0
7 3 2015-04-01 Yes 90 0. 90
8 3 2015-04-10 No 99 0. 99
9 3 2015-04-01 Yes 90 0. 90
10 3 2015-04-10 No 99 0. 99
我的问题是,ifelse()提供错误结果,而其他情况提供期望结果的原因是什么?
答案 0 :(得分:8)
显然,您不了解ifelse
。它与if
和else
根本不同。该文档明确指出“ ifelse
返回的值与test
形状相同”,在您的示例中该向量是长度为1的向量。 mutate
然后将其回收。
这是一个简单的例子:
all(c(TRUE, TRUE))
#[1] TRUE
ifelse(all(c(TRUE, TRUE)), 1:2, 3:4) #test is vector of length 1
#[1] 1
ifelse(c(TRUE, FALSE), 1:2, 3:4) #test is vector of length 2
#[1] 1 4
我鼓励您研究ifelse
函数的源代码,这应该很清楚为什么它会如此工作。