对于我的论文,我必须为几个参与者估算价值。我正在使用时间序列数据,每个参与者都有297行和18列(变量)。 我想为每个参与者估算值,因此我必须为每297行执行一次估算方法。 这些行标记有参与者ID(因此,第一个参与者为297乘以1)。 如何遍历这个庞大的数据集以对每个主题进行插补?
提前谢谢!
示例数据:
Participant ID Var1 Var2
1 2.5 2.3
1 NA 2.5
1 2.2 2.4
1 2.6 2.5
2 2.2 2.2
2 2.3 2.4
2 NA NA
2 NA NA
在此示例中,每个参与者使用4行,但每个参与者拥有297行。我想分别为每个参与者和每个变量执行插补方法。
答案 0 :(得分:2)
您可以尝试
library(tidyverse)
library(Hmisc)
df %>%
group_by(Participant_ID) %>%
mutate_at(vars(-1), .funs = Hmisc::impute)