将列拆分为几个变量,然后将相应的值移至新列

时间:2018-06-21 09:37:15

标签: r dplyr

我有一个这样的数据框(还有更多行):

   id act_l_n pas_l_n act_q_p pas_q_p act_l_p pas_l_p act_q_n pas_q_n
    1      14       8      14      10      21      11      21      11
    2      19       9      11      17      22      11      20      11

每个列名都包含有关三个变量的信息,这些变量用'_'分隔(每个变量有2个级别,分别称为act / pas,l / q,n / p)。值是对应于每个变量组合的得分(即8个条件中的1个)。

我需要将3个变量移动到3个单独的列中,用数字标记它们的级别,然后将相应的值移动到称为“得分”的单独列中。因此,从当前数据帧的第一行中,我会得到以下信息:

id  score   actpas lq   pn
1   14       1     1    1
1   8        2     1    1
1   14       1     2    2
1   10       2     2    2
1   21       1     1    2
1   11       2     1    2
1   21       1     2    1
1   11       2     2    1

我已经尝试使用收集和单独的功能与dplyr进行此操作,但是我无法真正获得所需的东西。最好使用dplyr的帮助!

1 个答案:

答案 0 :(得分:2)

如果我理解得很好:

df<-read.table(textConnection(
"id,act_l_n,pas_l_n,act_q_p,pas_q_p,act_l_p,pas_l_p,act_q_n,pas_q_n
1,14,8,14,10,21,11,21,11
2,19,9,11,17,22,11,20,11"),
header=TRUE,sep=",")

library(tidyr)
library(dplyr)
gather(df,k,score,-id) %>% mutate(v1=1+as.integer(substr(k,1,3)=="pas")
                                 ,v2=1+as.integer(substr(k,5,5)=="q")
                                 ,v3=1+as.integer(substr(k,7,7)=="p")) %>%
  select(-2) %>% arrange(id)
#   id score v1 v2 v3
#1   1    14  1  1  1
#2   1     8  2  1  1
#3   1    14  1  2  2
#4   1    10  2  2  2
#5   1    21  1  1  2
#6   1    11  2  1  2
#7   1    21  1  2  1
#8   1    11  2  2  1
#9   2    19  1  1  1
#10  2     9  2  1  1
#11  2    11  1  2  2
#12  2    17  2  2  2
#13  2    22  1  1  2
#14  2    11  2  1  2
#15  2    20  1  2  1
#16  2    11  2  2  1