我正在通过蛋白质组学数据进行高度分析,并具有数千个5x5矩阵,其中每个矩阵中的行和列表示不同的生物学条件,每个细胞指的是该对生物学条件下的基因表达。
我希望此数据集中包含三种蛋白质:
在大多数情况下,我希望不会有大的变化,但是单元之间会出现随机波动:
0 0 -1 -2 1
2 1 0 -1 -1
0 0 1 2 0
1 -2 1 3 0
-3 1 2 0 0
在某些情况下,某些样本可能被污染,并且可能存在一些极端的异常值,例如如果(2,2)和(3,4)是离群值:
1 0 0 -2 1
0 84 1 -1 -1
-1 0 0 2 0
0 1 99 3 0
1 -3 2 0 0
但是,我感兴趣的情况是蛋白质表达朝着特定的最佳生物学条件对变化的情况。蛋白质改变表达的位置达到(3,4)细胞的最佳点:
0 0 5 12 8
1 5 20 36 21
0 10 31 52 40
1 -2 17 23 30
-3 1 12 5 8
在上面的示例中是否有统计测试来确定最佳像元,并且像前两种情况一样,它对于处理异常值和随机波动也很可靠?
谢谢。