如何使散点图显示单个基因与多个基因之间的相关性?

时间:2018-07-05 16:17:25

标签: r plot graphics scatter-plot

我有一个矩阵,其中样本作为行,基因作为列,具有基因表达值(RPKM)。

以下是示例数据。原始数据有800多个样本。

        LINP1   EGFR            RB1       TP53         CDKN2A      MYC
Sample1 0.02   0.038798682  0.1423662   2.778587067 0.471403939 18.93687655
Sample2 0      0.059227225  0.208765213 0.818810739 0.353671882 1.379027685
Sample3 0      0.052116384  0.230437735 2.535040249 0.504061015 9.773089223
Sample4 0.06   0.199264618  0.261100548 2.516963635 0.63659138  11.01441624
Sample5 0      0.123521916  0.273330986 2.751309388 0.623572499 34.0563519
Sample6 0      0.128767634  0.263491811 2.882878373 0.359322715 13.02402045
Sample7 0      0.080097356  0.234511372 3.568192768 0.386217698 9.068928569
Sample8 0      0.017421323  0.247775683 5.109428797 0.068760572 15.7490551
Sample9 0      2.10281137   0.401582013 8.202902242 0.140596724 60.25989178

要绘制散点图以显示两个基因之间的相关性,我使用了ggscatter

ggscatter(A2, x = "LINP1", y = "EGFR", 
          add = "reg.line", conf.int = FALSE, 
          cor.coef = TRUE, cor.method = "pearson",
          xlab = "LINP1", ylab = "EGFR", xscale="log2", yscale="log2")

散点图看起来像这样

scatterplot

我想绘制这样的散点图

scatterplot

Research paper中的图2g。其中在单个图中显示了针对所有其他基因的LINP1表达。任何代码都可以吗?

1 个答案:

答案 0 :(得分:2)

在进行皮尔逊相关分析时,结果与执行散点图并从回归模型中绘制拟合线的结果相同,该回归模型可以在windowName中与基因的散点图结合完成。

编辑: 更新为根据OP的注释在两个范围内使用log2()转换。请注意,进行转换时,有时可能会获得无效值。您的数据有window.name个,因此log2()转换返回ggplot2::geom_smooth()

0

enter image description here