按组的R中的行和列矩阵总和

时间:2020-03-08 21:21:10

标签: r matrix sum rowsum

我有一个矩阵matrix,具有两个级别的分组,如行和列的名称所示。

           UKC1_SS1   UKC1_SS2   UKC2_SS1   UKC2_SS2
UKC1_SS1       1          2          3          4
UKC1_SS2       5          6          7          8
UKC2_SS1       9         10         11         12
UKC2_SS2      13         14         15         16

我要创建一个具有列和行总和的表,该表基于列和行名的前四位:

      UKC1   UKC2   
UKC1    14     22  
UKC2    46     54  

我尝试依次计算rowsumscolSums

sum.matrix <- rowsum(matrix, substr(rownames(matrix), start = 1, stop = 4))
sum.matrix <- colSums(sum.matrix, substr(colnames(test), start = 1, stop = 4)

但是我收到以下错误消息: colSums(test,substr(colnames(test),start = 1,stop = 4))中的错误: 无效的“ na.rm”参数

运行sum(is.na)时,我确认matrix中有NA值。

1 个答案:

答案 0 :(得分:6)

sum更改为第1个4个字符的xtabs后,我们可以用dimnamessubstr

dimnames(m1) <- lapply(dimnames(m1), substr, 1, 4)
xtabs(Freq~ Var1 + Var2, as.data.frame.table(m1))
#      Var2
#Var1   UKC1 UKC2
#  UKC1   14   22
#  UKC2   46   54

数据

m1 <- structure(c(1L, 5L, 9L, 13L, 2L, 6L, 10L, 14L, 3L, 7L, 11L, 15L, 
4L, 8L, 12L, 16L), .Dim = c(4L, 4L), .Dimnames = list(c("UKC1_SS1", 
"UKC1_SS2", "UKC2_SS1", "UKC2_SS2"), c("UKC1_SS1", "UKC1_SS2", 
 "UKC2_SS1", "UKC2_SS1.1")))