重命名一系列列名称中的变量

时间:2019-10-01 12:41:10

标签: r dplyr rename

我有一些像下面这样的变量:

colnames(samp)

 [1] "Q11_1_1"  "Q11_1_2"  "Q11_1_3"  "Q11_1_4"  "Q11_1_5"  "Q11_1_6"  "Q11_1_7"  "Q11_1_8"  "Q11_1_9"  "Q11_1_10"
[11] "Q11_1_11" "Q11_1_12" "Q11_1_99" "Q11_2_1"  "Q11_2_2"  "Q11_2_3"  "Q11_2_4"  "Q11_2_5"  "Q11_2_6"  "Q11_2_7" 
[21] "Q11_2_8"  "Q11_2_9"  "Q11_2_10" "Q11_2_11" "Q11_2_12" "Q11_2_99"

我想在中间和结尾交换值,例如

Q11_1_1-> Q11_1_1

Q11_1_2-> Q11_2_1

...

Q11_1_99-> Q11_99_2

我可以用这种方式来做(但这很耗时)。

samp %>% 
rename(Q11_1_2 = Q11_2_1) 

有什么想法吗?

5 个答案:

答案 0 :(得分:5)

这是两种不同的选择。第一个更紧凑,但是第二个避免使用正则表达式。两者均未使用任何软件包。

1)子,像这样使用sub

# test data
DF <- data.frame("Q11_1_1" = 1, "Q11_1_2"  = 2, "Q11_1_3" = 3)

names(DF) <- sub("(\\d+)_(\\d+)$", "\\2_\\1", names(DF))

DF
##   Q11_1_1 Q11_2_1 Q11_3_1
## 1       1       2       3

2)read.table (该表更长),但不使用任何正则表达式。

# test data
DF <- data.frame("Q11_1_1" = 1, "Q11_1_2"  = 2, "Q11_1_3" = 3)

names(DF) <- with(read.table(text = names(DF), sep = "_"), paste(V1, V3, V2, sep="_"))

DF
##   Q11_1_1 Q11_2_1 Q11_3_1
## 1       1       2       3

如果不是所有的列都具有指示的形式,则将选择那些列,然后对其进行转换。在这种情况下,我们需要它们全部,因此不需要它,但是如果还有其他列,则可以使用。

ix <- grep("_.*_", names(DF))  # 1:3
names(DF)[ix] <- 
with(read.table(text = names(DF)[ix], sep = "_"), paste(V1, V3, V2, sep="_"))

答案 1 :(得分:2)

一种可能的解决方案。

colconvert <- function(a){
    paste0(strsplit(a,"_",fixed = TRUE)[[1]][1],"_",strsplit(a,"_",fixed = TRUE)[[1]][3],"_",strsplit(a,"_",fixed = TRUE)[[1]][2])
}

names(samp) <- lapply(names(samp), colconvert)

输出:

[[1]]
[1] "Q11_1_1"

[[2]]
[1] "Q11_2_1"

[[3]]
[1] "Q11_3_1"

[[4]]
[1] "Q11_4_1"

[[5]]
[1] "Q11_5_1"

答案 2 :(得分:0)

我能想到的最快的方法是strsplitpaste的组合:

colnames(samp) <- as.vector(sapply(colnames(samp), function(x){ splitted <- unlist(strsplit(x,"_")) ; paste(splitted[1],splitted[3],splitted[2],sep="_") }))

答案 3 :(得分:0)

您可以执行拆分订单-粘贴方法。

colnames(samp) <- 
  mapply(function(x) paste(x[c(1, 3:2)], collapse="_"), strsplit(colnames(samp), "_"))

colnames(samp)
# [1] "Q11_1_1"  "Q11_1_2"  "Q11_1_3"  "Q11_1_4"  "Q11_1_5"  "Q11_1_6"  "Q11_1_7"  "Q11_1_8" 
# [9] "Q11_1_9"  "Q11_1_10" "Q11_1_11" "Q11_1_12" "Q11_1_99" "Q11_2_1"  "Q11_2_2"  "Q11_2_3" 
# [17] "Q11_2_4"  "Q11_2_5"  "Q11_2_6"  "Q11_2_7"  "Q11_2_8"  "Q11_2_9"  "Q11_2_10" "Q11_2_11"
# [25] "Q11_2_12" "Q11_2_99"

数据

samp <- structure(c(NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, 
NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA), .Dim = c(1L, 
26L), .Dimnames = list(NULL, c("Q11_1_1", "Q11_1_2", "Q11_1_3", 
"Q11_1_4", "Q11_1_5", "Q11_1_6", "Q11_1_7", "Q11_1_8", "Q11_1_9", 
"Q11_1_10", "Q11_1_11", "Q11_1_12", "Q11_1_99", "Q11_2_1", "Q11_2_2", 
"Q11_2_3", "Q11_2_4", "Q11_2_5", "Q11_2_6", "Q11_2_7", "Q11_2_8", 
"Q11_2_9", "Q11_2_10", "Q11_2_11", "Q11_2_12", "Q11_2_99")))

答案 4 :(得分:0)

使用stringr

library(stringr)
# test data
df <- data.frame("Q11_1_1" = 1, "Q11_1_2"  = 32, "Q11_1_3" = 3, "Q11_1_99" = 
       4)
ColNames = colnames(df)
# initialise an empty vector to hold new column names
new_ColNames = vector()
for (i in 1:length(ColNames)) {
  splited = str_split(ColNames[i], "_")
  new_ColNames[i] = paste(splited[[1]][1],splited[[1]][3],splited[[1]][2], 
                          sep = "_")
}
# assign new colmun names to the df
colnames(df) = new_ColNames

输出:

> df
  Q11_1_1 Q11_2_1 Q11_3_1 Q11_99_1
1       1      32       3        4