我有两个需要连接的数据集,并且需要复制观察以避免NA,因为我将对数据进行回归。但是,我正在努力使其发挥作用。
我目前有两个类似的数据集:
儿童
Participant_id Family_no Score_c Gender_c
A1 1 300 .5
B1 1 400 -.5
C1 2 500 -.5
D1 2 450 .5
E1 2 600 .5
F1 3 350 -.5
家长
Participants_id Family_no Score_p Gender_p Q_score
A2 1 200 .5 3
B2 1 350 -.5 3.5
C2 2 300 .5 2
D2 3 250 -.5 3.9
E2 3 300 -.5 4
我想将他们联合起来创建一个数据集,其中每个孩子由一个家庭中的每个父母代表。例如,如果一个家庭有两个父母和一个孩子,则该孩子的数据代表两次,反之亦然,如果有两个父母和两个孩子,则每个家庭每次观察两次。即像这样(参与者专栏没有必要):
Participant_id Family_no Score_c Score_p Gender_c Gender_p Q_score
A1+A2 1 300 200 .5 .5 3
A1+B2 1 300 350 .5 -.5 3.5
B1+A2 1 400 200 -.5 .5 3
B1+B2 1 400 350 -.5 -.5 3.5
C1+C2 2 500 300 -.5 .5 2
D1+C2 2 450 300 .5 .5 2
E1+C2 2 600 300 .5 .5 2
F1+D2 3 350 250 -.5 -.5 3.9
F1+E2 3 350 300 -.5 -.5 4
我最好使用tidyverse,但我愿意接受其他建议!
提前致谢,
朱莉娅