我有一个大矩阵,其中包含从微观细胞图像中提取的各种特征。不同的特征分布在各列上,各个单元跨越该矩阵的行。然而,测量来自时间推移显微镜,使得每个单独的单元在该矩阵中具有90行(时间点)。所以这个矩阵的维数为[cell_amount * 90; feature_amount]。
我的目标是:
我在R中设置了一些代码来测试我的问题,其中我有4个单元格,4个要素(列),每个单元格有3个时间点值。因此第一个单元格将位于第1-3行,第二个单元格位于第4-6行,依此类推。由此我计算出值的差异:
A <- matrix(sample(1:100, 4*12), ncol = 4)
B <- abs( A - dplyr::lag(A) )
B[seq(1,nrow(B), 3),] <- NA
这导致矩阵,其中每个单元格的第一行包含NA值:
[,1] [,2] [,3] [,4]
[1,] NA NA NA NA
[2,] 82 29 54 22
[3,] 32 44 18 31
[4,] NA NA NA NA
[5,] 22 61 10 33
[6,] 19 64 54 35
[7,] NA NA NA NA
[8,] 59 18 6 10
[9,] 34 47 70 6
[10,] NA NA NA NA
[11,] 60 23 68 22
[12,] 17 13 12 9
结果矩阵包含每个单元格的值的聚合,在这种情况下是方差,应该如下所示:
[,1] [,2] [,3] [,4]
[1,] 1250 112.5 648 40.5
[2,] 4.5 4.5 968 2
[3,] 312.5 420.5 2048 8
[4,] 924.5 50 1568 84.5
如何在R中计算这个新矩阵?任何帮助表示赞赏。
答案 0 :(得分:0)
由于您使用的是没有种子的随机样本,因此无法重新创建A
矩阵。但是,这里是您B
矩阵的重新创建。
B <- matrix(scan(text="
NA NA NA NA
82 29 54 22
32 44 18 31
NA NA NA NA
22 61 10 33
19 64 54 35
NA NA NA NA
59 18 6 10
34 47 70 6
NA NA NA NA
60 23 68 22
17 13 12 9"), ncol=4, byrow=T)
如果你真的想把它保持为一个矩阵,你可以将其重新整形为一个多维数组,并使用边距应用来获得感兴趣的值,例如
apply(array(B, dim=c(3,4,4)),2:3, var, na.rm=T)
# [,1] [,2] [,3] [,4]
# [1,] 1250.0 112.5 648 40.5
# [2,] 4.5 4.5 968 2.0
# [3,] 312.5 420.5 2048 8.0
# [4,] 924.5 50.0 1568 84.5
您还可以创建适当的分组变量并使用aggregate()
row_sample <- rep(1:3, each=nrow(B)/3)
aggregate(B, list(row_sample), var, na.rm=T)
# Group.1 V1 V2 V3 V4
# 1 1 1250.0000 112.5000 648.0000 40.50000
# 2 2 496.3333 662.3333 709.3333 193.00000
# 3 3 469.0000 305.3333 1084.0000 72.33333