我正在进行一些分析工作,在相同样本之间运行软件后,我得到了像这样的输出
>software1
>id sample1 sample2
a 0 0
b 0 0
c 0 0
d 0 0
e 0 0
f 0 0
g 0.518775 0.549079
h 0.0233247 0.101596
i 15.8679 15.45
>software2
>id sample1 sample2
a 0 0
b 0 0
c 0 0
d 0 0
e 0 0
f 0 0
g 18.6225669551756 23.7346441585572
h 199.37101093188 157.926670747323
i 10.9544511501033 3.65148371670111
现在我想比较或关联使用的不同软件之间的样本......例如来自software1的sample1和来自software2的sample1之间的样本 来自software1的sample2和来自software2的sample2
我是R的新手并且学习它并且任何帮助都会很棒?
我现在使用cor函数计算了样本之间的相关性。我在它们之间开发了热图吗?
答案 0 :(得分:2)
cor(software1[c("sample1", "sample2")],
software2[c("sample1", "sample2")])
# sample1 sample2
# sample1 -0.08296432 -0.1202152
# sample2 -0.07804807 -0.1151872
我会注意到这些例子中的零个数量提出了一个问题,即是否需要一种不同于相关性的汇总方法。 Pearson相关性假设两个向量将从具有较低重复概率的连续分布中提取。