我有两个看起来像这样的数据帧(1)
GeneID OTU B_F
Zm00001d002422 OTU_3525 B
Zm00001d008299 OTU_3525 B
Zm00001d008956 OTU_3525 B
Zm00001d021674 OTU_8672 B
Zm00001d025402 OTU_8672 B
Zm00001d003553 OTU_211 B
Zm00001d004592 OTU_211 B
Zm00001d004721 OTU_211 B
和(2)
GeneID OTU B_F
Zm00001d002422 OTU_29 F
Zm00001d003793 OTU_29 F
Zm00001d004162 OTU_29 F
Zm00001d019227 OTU_867 F
Zm00001d023804 OTU_867 F
Zm00001d024027 OTU_867 F
Zm00001d008305 OTU_87 F
Zm00001d011642 OTU_87 F
Zm00001d013177 OTU_87 F
Zm00001d003553 OTU_87 F
唯一的区别是(1)是B(2)是F,并且OTU名称不同。 实际文件要长得多。
一些geneID在表之间重叠。
我想获取表(1)和表(2)的OTU之间的相关值,所以结果相关矩阵应该是这样的:
P-val OTU_3525 OTU_8672 OTU_211
OTU_29 0.03 1 1
OTU_867 1 1 1
OTU_87 1 1 0.04
Corr. coeff OTU_3525 OTU_8672 OTU_211
OTU_29 0.3 0 0
OTU_867 1 0 0
OTU_87 0 0 0.2
R中有一种方法可以执行此计算吗?