使用dplyr按自定义顺序排列行

时间:2017-09-09 09:47:07

标签: r dplyr data-manipulation

arrange中使用dplyr函数,我们可以按升序或降序排列行。想知道如何按自定义顺序排列行。请参阅MWE。

Reg <- rep(LETTERS[1:3], each = 2)
Res <- rep(c("Urban", "Rural"), times = 3)
set.seed(12345)
Pop <- rpois(n = 6, lambda = 500000)
df <- data.frame(Reg, Res, Pop)

df
   Reg   Res    Pop
1    A Urban 500414
2    A Rural 500501
3    B Urban 499922
4    B Rural 500016
5    C Urban 501638
6    C Rural 499274

df %>%
  arrange()

所需输出

   Reg   Res    Pop
5    C Urban 501638
6    C Rural 499274
1    A Urban 500414
2    A Rural 500501
3    B Urban 499922
4    B Rural 500016

3 个答案:

答案 0 :(得分:34)

我们可以使用factor以自定义方式更改order

df %>%
    arrange(factor(Reg, levels = LETTERS[c(3, 1, 2)]), desc(Res), desc(Pop))
#  Reg   Res    Pop
#1   C Urban 501638
#2   C Rural 499274
#3   A Urban 500414
#4   A Rural 500501
#5   B Urban 499922
#6   B Rural 500016

或者使用match获取索引并在其上arrange

df %>%
    arrange(match(Reg, c("C", "A", "B")), desc(Res), desc(Pop))

如果我们按降序排列arrange多列

df %>%
     arrange_at(2:3, desc) %>%
     arrange(match(Reg, c("C", "A", "B")))

答案 1 :(得分:1)

使用 data.table

df1[order(factor(Reg,levels = LETTERS[c(3,1,2)]))]

这里df1是data.table

答案 2 :(得分:0)

我使用了 slice()函数:

   df %<>%
   slice(5,6,1:4)