使用自定义顺序重新排序行

时间:2014-10-24 13:06:07

标签: r dplyr

鉴于数据:

library(data.table)
DT = data.table(category=LETTERS[1:3], b=1:3)
DT
#    category b
# 1:        A 1
# 2:        B 2
# 3:        C 3

使用dplyr,如何重新排列行以在c("C", "A", "B")中获取特定订单category

#    category b
# 1:        C 3
# 2:        A 1
# 3:        B 2

2 个答案:

答案 0 :(得分:63)

首先,创建一个包含所需顺序字母的向量。然后match *带有要变量的变量的向量。 match返回(第一个)匹配的索引,可以插入slice

library(dplyr)

# create a vector with letters in the desired order
x <- c("C", "A", "B")

DT %>%
  slice(match(x, category))
#   category b
# 1        C 3
# 2        A 1
# 3        B 2

另一种方法是将“类别”转换为factor,将levels设置为所需的顺序,然后使用arrange

DT %>%
  mutate(category =  factor(category, levels = x)) %>%
  arrange(category)    
#   category b
# 1        C 3
# 2        A 1
# 3        B 2

* match方法的灵感来自this answer

答案 1 :(得分:1)

另一种可能是以下内容,请注意,arrange 可以获取新索引列表。

library(dplyr)

df <- data.frame(category = LETTERS[1:3], b = 1:3, stringsAsFactors = F)

# create a vector with letters in the desired order
x <- c("C", "A", "B")

df %>%
arrange(sapply(category, function(y) which(y == x))