整洁:创建没有rowwise()的键?

时间:2019-04-01 13:44:30

标签: r dplyr key tibble rowwise

是否有一种无需使用key即可创建rowwise()的方法?

非常感谢任何指针。

df <- tibble(grp1=rev(LETTERS[1:5]),grp2=letters[11:15],grp3=LETTERS[1:5],
      value=rnorm(5,10,10))

df %>% rowwise %>% mutate(key=paste(sort(c(grp1, grp2)), collapse="")) %>% ungroup()
  grp1  grp2  grp3  value             key  
  <chr> <chr> <chr> <chr>             <chr>
1 E     k     A     -3.73984194875213 AE   
2 D     l     B     3.25846392371014  BD   
3 C     m     C     3.62405652088127  CC   
4 B     n     D     6.41520621902784  BD   
5 A     o     E     20.1892413026407  AE 

更新:tibble包含多个字符向量,但是key应该从列grp1grp3生成。

3 个答案:

答案 0 :(得分:3)

使用purrr::pmap_chr

library(tidyverse)
df %>% mutate(key=pmap_chr(.[c("grp1","grp3")],~paste(sort(c(...)), collapse="")))
# # A tibble: 5 x 5
#   grp1  grp2  grp3  value             key  
#   <chr> <chr> <chr> <chr>             <chr>
# 1 E     k     A     22.0150932758833  AE   
# 2 D     l     B     2.24725610156698  BD   
# 3 C     m     C     -6.2414882455089  CC   
# 4 B     n     D     22.5699168856552  BD   
# 5 A     o     E     -6.21443670571301 AE 

在基数R中,您可以执行以下操作:

transform(df, key=mapply(function(...) paste(sort(c(...)), collapse=""), grp1, grp3)

答案 1 :(得分:2)

这是使用pmin/pmap的向量化选项。将列“ grp1”,“ grp3”的每一行与min/max的{​​{1}}并连接在一起(pmin/pmax

str_c

数据

library(dplyr)
library(stringr)
df %>%
   mutate(key = str_c(pmin(grp1, grp3), pmax(grp1, grp3)))
# A tibble: 5 x 5
#  grp1  grp2  grp3   value key  
#  <chr> <chr> <chr>  <dbl> <chr>
#1 E     k     A      24.7  AE   
#2 D     l     B       5.66 BD   
#3 C     m     C      16.3  CC   
#4 B     n     D       5.88 BD   
#5 A     o     E      -9.22 AE   

注意:df <- tibble(grp1=rev(LETTERS[1:5]),grp2=letters[11:15],grp3=LETTERS[1:5], value=rnorm(5,10,10)) 转换为cbind,矩阵只能容纳一个类。使用matrix转换为tibble不会自动更改类。相反,请直接使用as_tibble而不是tibble/data.frame路由

答案 2 :(得分:1)

另一种方法是使用mutate,不使用rowwise,但使用函数的矢量化版本,如下所示:

library(dplyr)

# create a function and vectorise it
f = function(x, y) paste(sort(c(x, y)), collapse="")
f = Vectorize(f)

# use the function
df %>% mutate(key = f(grp1, grp3))

# # A tibble: 5 x 5
#   grp1  grp2  grp3  value             key  
#   <chr> <chr> <chr> <chr>             <chr>
# 1 E     k     A     -4.41213449814982 AE   
# 2 D     l     B     10.4314736952111  BD   
# 3 C     m     C     5.69345098226371  CC   
# 4 B     n     D     4.39266020802413  BD   
# 5 A     o     E     22.0623810028979  AE