我有一些像下面这样的变量:
colnames(samp)
[1] "Q11_1_1" "Q11_1_2" "Q11_1_3" "Q11_1_4" "Q11_1_5" "Q11_1_6" "Q11_1_7" "Q11_1_8" "Q11_1_9" "Q11_1_10"
[11] "Q11_1_11" "Q11_1_12" "Q11_1_99" "Q11_2_1" "Q11_2_2" "Q11_2_3" "Q11_2_4" "Q11_2_5" "Q11_2_6" "Q11_2_7"
[21] "Q11_2_8" "Q11_2_9" "Q11_2_10" "Q11_2_11" "Q11_2_12" "Q11_2_99"
我想在中间和结尾交换值,例如
Q11_1_1-> Q11_1_1
Q11_1_2-> Q11_2_1
...
Q11_1_99-> Q11_99_2
我可以用这种方式来做(但这很耗时)。
samp %>%
rename(Q11_1_2 = Q11_2_1)
有什么想法吗?
答案 0 :(得分:5)
这是两种不同的选择。第一个更紧凑,但是第二个避免使用正则表达式。两者均未使用任何软件包。
1)子,像这样使用sub
:
# test data
DF <- data.frame("Q11_1_1" = 1, "Q11_1_2" = 2, "Q11_1_3" = 3)
names(DF) <- sub("(\\d+)_(\\d+)$", "\\2_\\1", names(DF))
DF
## Q11_1_1 Q11_2_1 Q11_3_1
## 1 1 2 3
2)read.table (该表更长),但不使用任何正则表达式。
# test data
DF <- data.frame("Q11_1_1" = 1, "Q11_1_2" = 2, "Q11_1_3" = 3)
names(DF) <- with(read.table(text = names(DF), sep = "_"), paste(V1, V3, V2, sep="_"))
DF
## Q11_1_1 Q11_2_1 Q11_3_1
## 1 1 2 3
如果不是所有的列都具有指示的形式,则将选择那些列,然后对其进行转换。在这种情况下,我们需要它们全部,因此不需要它,但是如果还有其他列,则可以使用。
ix <- grep("_.*_", names(DF)) # 1:3
names(DF)[ix] <-
with(read.table(text = names(DF)[ix], sep = "_"), paste(V1, V3, V2, sep="_"))
答案 1 :(得分:2)
一种可能的解决方案。
colconvert <- function(a){
paste0(strsplit(a,"_",fixed = TRUE)[[1]][1],"_",strsplit(a,"_",fixed = TRUE)[[1]][3],"_",strsplit(a,"_",fixed = TRUE)[[1]][2])
}
names(samp) <- lapply(names(samp), colconvert)
输出:
[[1]]
[1] "Q11_1_1"
[[2]]
[1] "Q11_2_1"
[[3]]
[1] "Q11_3_1"
[[4]]
[1] "Q11_4_1"
[[5]]
[1] "Q11_5_1"
答案 2 :(得分:0)
我能想到的最快的方法是strsplit
和paste
的组合:
colnames(samp) <- as.vector(sapply(colnames(samp), function(x){ splitted <- unlist(strsplit(x,"_")) ; paste(splitted[1],splitted[3],splitted[2],sep="_") }))
答案 3 :(得分:0)
您可以执行拆分订单-粘贴方法。
colnames(samp) <-
mapply(function(x) paste(x[c(1, 3:2)], collapse="_"), strsplit(colnames(samp), "_"))
colnames(samp)
# [1] "Q11_1_1" "Q11_1_2" "Q11_1_3" "Q11_1_4" "Q11_1_5" "Q11_1_6" "Q11_1_7" "Q11_1_8"
# [9] "Q11_1_9" "Q11_1_10" "Q11_1_11" "Q11_1_12" "Q11_1_99" "Q11_2_1" "Q11_2_2" "Q11_2_3"
# [17] "Q11_2_4" "Q11_2_5" "Q11_2_6" "Q11_2_7" "Q11_2_8" "Q11_2_9" "Q11_2_10" "Q11_2_11"
# [25] "Q11_2_12" "Q11_2_99"
samp <- structure(c(NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,
NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA), .Dim = c(1L,
26L), .Dimnames = list(NULL, c("Q11_1_1", "Q11_1_2", "Q11_1_3",
"Q11_1_4", "Q11_1_5", "Q11_1_6", "Q11_1_7", "Q11_1_8", "Q11_1_9",
"Q11_1_10", "Q11_1_11", "Q11_1_12", "Q11_1_99", "Q11_2_1", "Q11_2_2",
"Q11_2_3", "Q11_2_4", "Q11_2_5", "Q11_2_6", "Q11_2_7", "Q11_2_8",
"Q11_2_9", "Q11_2_10", "Q11_2_11", "Q11_2_12", "Q11_2_99")))
答案 4 :(得分:0)
使用stringr
:
library(stringr)
# test data
df <- data.frame("Q11_1_1" = 1, "Q11_1_2" = 32, "Q11_1_3" = 3, "Q11_1_99" =
4)
ColNames = colnames(df)
# initialise an empty vector to hold new column names
new_ColNames = vector()
for (i in 1:length(ColNames)) {
splited = str_split(ColNames[i], "_")
new_ColNames[i] = paste(splited[[1]][1],splited[[1]][3],splited[[1]][2],
sep = "_")
}
# assign new colmun names to the df
colnames(df) = new_ColNames
输出:
> df
Q11_1_1 Q11_2_1 Q11_3_1 Q11_99_1
1 1 32 3 4