按列名称拆分R中的矩阵

时间:2013-07-24 14:10:03

标签: r

我有一个包含6列的矩阵,如:

c_1 C_2 A_1 A_2 D_1 D_2 ..
 2  3  3  3  3  3  3
 4  4  4  4  2  2  2

我想打破这个具有相同前缀的三个矩阵:

c_1 c_2
2  3
4  4

A_1 A_2
3 3
4 4 

3 个答案:

答案 0 :(得分:5)

假设矩阵中的大小写混合大小写c是拼写错误,那么这样的东西应该有效:

m <- matrix(1:12,2,6)
colnames(m) <- paste(rep(letters[1:3],each = 2),1:2,sep = '_')
out <- split.data.frame(t(m),f = substr(rownames(t(m)),1,1))
out <- lapply(out,t)
> out
$a
     a_1 a_2
[1,]   1   3
[2,]   2   4

$b
     b_1 b_2
[1,]   5   7
[2,]   6   8

$c
     c_1 c_2
[1,]   9  11
[2,]  10  12

答案 1 :(得分:1)

这取决于你想要做什么。以下是一些例子:

mat <- structure(c(3L, 4L, 3L, 4L, 3L, 4L, 3L, 2L, 3L, 2L, 3L, 2L), 
                 .Dim = c(2L,6L), 
                 .Dimnames = list(c("2", "4"), c("c_1", "c_2", "A_1", "A_2","D_1", "D_2")))

如果您只想手动提取某些行,可以使用

mat[,1:2]
mat[,3:4]
mat[,5:6]

如果要根据列名的第一个字母执行此操作,可以手动选择所需的列名:

mat[,substr(colnames(mat), 1, 1)=="A"]

或者您可以获得包含所有可能列名的列表

lst <- lapply(unique(substr(colnames(mat),1,1)), 
          function(x) mat[,substr(colnames(mat), 1, 1)==x])
names(lst) <- unique(substr(colnames(mat),1,1))
lst

答案 2 :(得分:1)

尝试类似:

library(stringr)
spl <- read.table(header=TRUE, text='
c_1 C_2 A_1 A_2 D_1 D_2 ..
2  3  3  3  3  3  3
4  4  4  4  2  2  2')
spl
names(spl) <- lapply(names(spl), tolower) # not sure if you want "c_1" w/ "C_2"
lapply(split(data.frame(t(spl)), str_extract(names(spl), "[A-Za-z]")), t)
# $a
# a_1 a_2
# X1   3   3
# X2   4   4
# 
# $c
# c_1 c_2
# X1   2   3
# X2   4   4
# 
# $d
# d_1 d_2
# X1   3   3
# X2   2   2

#or
lapply(split(data.frame(t(spl)), substr(names(spl), 1, 1)), t) # includes ".."