R:如何按小组对箱线图上的样本着色?

时间:2018-07-11 06:26:40

标签: r colors expression boxplot

我目前在矩阵中具有基因表达数据,矩阵中的样本按行排列,基因按行排列。我约有30,000个基因的300个样本。

数据的前三行是这样的:

         Sample1  Sample2  Sample3   Sample4   Sample5
Gene1    6.53845  6.38723  6.41613   6.07901   6.45148
Gene2    6.34303  6.52751  6.48025   6.79185   6.94955
Gene3    6.17286  6.31772  6.44266   6.61777   7.05509
...      ...    

依此类推,最多可显示30,000行和300个样本。

我已经能够使用R绘制数据的箱线图,但是现在我希望根据样品的批次/组为箱线图着色。

我有一张这样的批处理信息表。

Sample   Batch
Sample1  A
Sample2  A
Sample3  B
Sample4  A
Sample5  C
...      ...

以此类推,共8个批次。使用R,如何根据样品所属的批次为箱线图着色?谢谢!

1 个答案:

答案 0 :(得分:1)

其中一种方法可能是

render()
{
        return(
        < div>
        < h1> Hello < /h1>
        < /div>
        );
}

哪个情节

enter image description here

样本数据:

library(dplyr)
library(tidyr)
library(tibble)
library(ggplot2)

df %>%
  rownames_to_column("Genes") %>%                          #add rownames as column
  gather(Sample, Sample_value, -Genes) %>%                 #convert data to long format from wide format for plotting
  left_join(batch_lookup, by = "Sample") %>%               #join it with lookup table to add 'Batch' column
  ggplot(aes(x=Sample, y=Sample_value, color=Batch)) +     #plot data
    geom_boxplot()