我有一个包含6列的矩阵,如:
c_1 C_2 A_1 A_2 D_1 D_2 ..
2 3 3 3 3 3 3
4 4 4 4 2 2 2
我想打破这个具有相同前缀的三个矩阵:
c_1 c_2
2 3
4 4
A_1 A_2
3 3
4 4
答案 0 :(得分:5)
假设矩阵中的大小写混合大小写c
是拼写错误,那么这样的东西应该有效:
m <- matrix(1:12,2,6)
colnames(m) <- paste(rep(letters[1:3],each = 2),1:2,sep = '_')
out <- split.data.frame(t(m),f = substr(rownames(t(m)),1,1))
out <- lapply(out,t)
> out
$a
a_1 a_2
[1,] 1 3
[2,] 2 4
$b
b_1 b_2
[1,] 5 7
[2,] 6 8
$c
c_1 c_2
[1,] 9 11
[2,] 10 12
答案 1 :(得分:1)
这取决于你想要做什么。以下是一些例子:
mat <- structure(c(3L, 4L, 3L, 4L, 3L, 4L, 3L, 2L, 3L, 2L, 3L, 2L),
.Dim = c(2L,6L),
.Dimnames = list(c("2", "4"), c("c_1", "c_2", "A_1", "A_2","D_1", "D_2")))
如果您只想手动提取某些行,可以使用
mat[,1:2]
mat[,3:4]
mat[,5:6]
如果要根据列名的第一个字母执行此操作,可以手动选择所需的列名:
mat[,substr(colnames(mat), 1, 1)=="A"]
或者您可以获得包含所有可能列名的列表
lst <- lapply(unique(substr(colnames(mat),1,1)),
function(x) mat[,substr(colnames(mat), 1, 1)==x])
names(lst) <- unique(substr(colnames(mat),1,1))
lst
答案 2 :(得分:1)
尝试类似:
library(stringr)
spl <- read.table(header=TRUE, text='
c_1 C_2 A_1 A_2 D_1 D_2 ..
2 3 3 3 3 3 3
4 4 4 4 2 2 2')
spl
names(spl) <- lapply(names(spl), tolower) # not sure if you want "c_1" w/ "C_2"
lapply(split(data.frame(t(spl)), str_extract(names(spl), "[A-Za-z]")), t)
# $a
# a_1 a_2
# X1 3 3
# X2 4 4
#
# $c
# c_1 c_2
# X1 2 3
# X2 4 4
#
# $d
# d_1 d_2
# X1 3 3
# X2 2 2
#or
lapply(split(data.frame(t(spl)), substr(names(spl), 1, 1)), t) # includes ".."