基线缺失的重复ID从基线变化
下面已经提出并回答了类似的问题:
Change from baseline for repeated ids
我的问题与原始问题的不同之处在于我缺少基线值。我在下面列出了一个可重复的小例子:
df1 <- data.frame( probeID = c( rep("A", 19), rep("B",19), rep("C",19)),
Subject_ID = c( rep( c( rep(1,5), rep(2,4), rep(3,5), rep(4,5)),3)),
time = c(rep( c( c(1:5), c(2:5), rep( 1:5,2)),3)))
df1$measure <- df1$Subject_ID*c( 1:nrow(df1))
df2 <- subset( df1, Subject_ID != 2)
df2 %>%
group_by(probeID, Subject_ID) %>%
mutate(change = measure - measure[time==1])
但是,当我在上面的管道中用df1替换df2时,它会失败,因为Subject_ID = 2的time = 1数据点缺少数据。 df1情况下我想要的输出应该与df2的输出相同。我将不胜感激任何帮助。
由于
JJ
答案 0 :(得分:0)
在试图找出问题的要求时遇到了一些麻烦,这有用吗?
df1 %>%
group_by(probeID, Subject_ID) %>%
mutate(change = measure - first(measure))