使用行组

时间:2017-04-11 19:12:31

标签: r matrix aggregate

我有一个大矩阵,其中包含从微观细胞图像中提取的各种特征。不同的特征分布在各列上,各个单元跨越该矩阵的行。然而,测量来自时间推移显微镜,使得每个单独的单元在该矩阵中具有90行(时间点)。所以这个矩阵的维数为[cell_amount * 90; feature_amount]。

我的目标是:

  • 计算每个单元格的后续时间点的差异(时间序列的"导数")
  • 创建一个新矩阵,其中包含每个单元格的这些差异的聚合(以便新矩阵具有维度[cell_amount; feature_amount])。

我在R中设置了一些代码来测试我的问题,其中我有4个单元格,4个要素(列),每个单元格有3个时间点值。因此第一个单元格将位于第1-3行,第二个单元格位于第4-6行,依此类推。由此我计算出值的差异:

A <- matrix(sample(1:100, 4*12), ncol = 4)
B <- abs( A - dplyr::lag(A) )
B[seq(1,nrow(B), 3),] <- NA

这导致矩阵,其中每个单元格的第一行包含NA值:

       [,1] [,2] [,3] [,4]
[1,]    NA   NA   NA   NA
[2,]    82   29   54   22
[3,]    32   44   18   31
[4,]    NA   NA   NA   NA
[5,]    22   61   10   33
[6,]    19   64   54   35
[7,]    NA   NA   NA   NA
[8,]    59   18    6   10
[9,]    34   47   70    6
[10,]   NA   NA   NA   NA
[11,]   60   23   68   22
[12,]   17   13   12    9

结果矩阵包含每个单元格的值的聚合,在这种情况下是方差,应该如下所示:

       [,1]   [,2]  [,3]  [,4]
[1,]    1250  112.5 648   40.5
[2,]    4.5   4.5   968   2
[3,]    312.5 420.5 2048  8
[4,]    924.5 50    1568  84.5

如何在R中计算这个新矩阵?任何帮助表示赞赏。

1 个答案:

答案 0 :(得分:0)

由于您使用的是没有种子的随机样本,因此无法重新创建A矩阵。但是,这里是您B矩阵的重新创建。

B <- matrix(scan(text="
NA   NA   NA   NA
82   29   54   22
32   44   18   31
NA   NA   NA   NA
22   61   10   33
19   64   54   35
NA   NA   NA   NA
59   18    6   10
34   47   70    6
NA   NA   NA   NA
60   23   68   22
17   13   12    9"), ncol=4, byrow=T)

如果你真的想把它保持为一个矩阵,你可以将其重新整形为一个多维数组,并使用边距应用来获得感兴趣的值,例如

apply(array(B, dim=c(3,4,4)),2:3, var, na.rm=T)
#        [,1]  [,2] [,3] [,4]
# [1,] 1250.0 112.5  648 40.5
# [2,]    4.5   4.5  968  2.0
# [3,]  312.5 420.5 2048  8.0
# [4,]  924.5  50.0 1568 84.5

您还可以创建适当的分组变量并使用aggregate()

row_sample <- rep(1:3, each=nrow(B)/3)
aggregate(B, list(row_sample), var, na.rm=T)
#   Group.1        V1       V2        V3        V4
# 1       1 1250.0000 112.5000  648.0000  40.50000
# 2       2  496.3333 662.3333  709.3333 193.00000
# 3       3  469.0000 305.3333 1084.0000  72.33333