Question

我正在进行一些分析工作，在相同样本之间运行软件后，我得到了像这样的输出

>software1
>id sample1 sample2
 a  0           0
 b  0           0
 c  0           0
 d  0           0
 e  0           0
 f  0           0
 g  0.518775    0.549079
 h  0.0233247   0.101596
 i  15.8679     15.45


>software2
>id sample1 sample2
 a     0    0
 b     0    0
 c     0    0
 d     0    0
 e     0    0
 f     0    0
 g    18.6225669551756  23.7346441585572
 h   199.37101093188    157.926670747323
 i    10.9544511501033  3.65148371670111

现在我想比较或关联使用的不同软件之间的样本......例如来自software1的sample1和来自software2的sample1之间的样本来自software1的sample2和来自software2的sample2

我是R的新手并且学习它并且任何帮助都会很棒？

我现在使用cor函数计算了样本之间的相关性。我在它们之间开发了热图吗？

Answer 1

cor(software1[c("sample1", "sample2")],
    software2[c("sample1", "sample2")])

#             sample1    sample2
# sample1 -0.08296432 -0.1202152
# sample2 -0.07804807 -0.1151872

我会注意到这些例子中的零个数量提出了一个问题，即是否需要一种不同于相关性的汇总方法。 Pearson相关性假设两个向量将从具有较低重复概率的连续分布中提取。

R中样本列之间的相关性

1 个答案: