有没有更有效或更简洁的方法来使用tidyr :: gather使我的数据看起来“整洁”?

时间:2020-06-24 13:31:33

标签: r dplyr tidyverse tidyr tibble

我不熟悉tidyverse。我想看看我是否在使用此软件包中的功能时尽可能地高效/简洁。我怀疑我不是。

我的原始数据在每个列名中都有键符号。

   day         a_x        b_x        a_y         b_y
1    1 -0.56047565  1.2240818 -1.0678237  0.42646422
2    2 -0.23017749  0.3598138 -0.2179749 -0.29507148
...

我想使数据看起来整洁,就像这样:

     day sym         x      y
 1     1 a      0.118   0.702
 2     2 a     -0.947  -0.262
...
11     1 b      1.44    0.788
12     2 b      0.452   0.769

这是我的代码,可以进行上述转换:

library(tidyverse)
set.seed(123)

# example original table
d <- tibble(day=1:10,a_x=rnorm(10),b_x=rnorm(10),a_y=rnorm(10),b_y=rnorm(10))

# manipulations
d1 <- gather(d,a_x,b_x,key='sym',value='x') %>% mutate(sym=sub('_x','',sym)) %>% select(day,sym,x)
d2 <- gather(d,a_y,b_y,key='sym',value='y') %>% mutate(sym=sub('_y','',sym)) %>% select(day,sym,y)
d <- d1 %>% full_join(d2,by=c('day','sym'))

使用某些dydyverse函数以更少的行数或更有效地获得相同结果的更好方法是什么?

谢谢!

1 个答案:

答案 0 :(得分:5)

gather已退役,转而使用pivot_longer,这使这种转换更为简单。

tidyr::pivot_longer(d, cols = -day, 
                    names_to = c('sym', '.value'), names_sep = '_')

# A tibble: 20 x 4
#    day sym        x      y
#* <int> <chr>  <dbl>  <dbl>
#1     1 a     -0.560 -1.07 
#2     1 b      1.22   0.426
#3     2 a     -0.230 -0.218
#4     2 b      0.360 -0.295
#...
#...