Question

我有以下几个想用于制作散点图（使用ggplot2）的AA_Colon与BA_Colon的logcpm值基因匹配的散点图。

             gene   sample     logcpm
             <chr>    <chr>      <dbl>
 1 ENSG00000169903 AA_Colon 0.31536340
 2 ENSG00000145321 AA_Colon 0.19735593
 3 ENSG00000171560 AA_Colon 0.00000000
 4 ENSG00000171557 AA_Colon 0.19735593
 5 ENSG00000106327 AA_Colon 0.06882901
 6 ENSG00000228278 AA_Colon 0.13452328
 7 ENSG00000138115 AA_Colon 0.31536340
 8 ENSG00000148702 AA_Colon 0.00000000
 9 ENSG00000140107 AA_Colon 0.00000000
10 ENSG00000197723 AA_Colon 0.00000000
11 ENSG00000169903 BA_Colon 1.14724849
12 ENSG00000145321 BA_Colon 0.08113901
13 ENSG00000171560 BA_Colon 0.36654820
14 ENSG00000171557 BA_Colon 0.23088996
15 ENSG00000106327 BA_Colon 0.08113901
16 ENSG00000228278 BA_Colon 0.08113901
17 ENSG00000138115 BA_Colon 0.42987550
18 ENSG00000148702 BA_Colon 0.00000000
19 ENSG00000140107 BA_Colon 0.00000000
20 ENSG00000197723 BA_Colon 0.08113901

目前，我正在做（有效）：

tibble %>%
    spread(key = sample, value = logcpm) %>%
    ggplot(aes(x = AA_Colon, y = BA_Colon)) +
    geom_point()

但是，我想知道是否有更优雅的方式直接使用整洁的格式并提取两个向量来绘制而不是将数据分散到两列。

Answer 1

当数据格式整齐时，ggplot只给出两列点的散点图，一列用于AA_Colon，另一列用于BA_Colon。

ggplot(tibble, aes(x = sample, y = logcpm)) + 
        geom_point()

使用geom_jitter的箱形图可能会更有用。

ggplot(tibble, aes(x = sample, y = logcpm)) +
geom_boxplot() + 
geom_jitter(width = 0.3)

使用dplyr＆amp; amp;和tpble的列中的变量的散点图。 GGPLOT2

1 个答案: