重复绘制R中的ggplots

时间:2017-09-07 13:21:03

标签: r for-loop ggplot2 dplyr tidyr

之前已经问过这个问题,但不是以适合我的数据的方式,所以我再试一次:)

我想制作多个单独的ggplots,而不必指定每次都应该如何制作。 我的数据集包含基因表达数据,我想从中绘制特定基因。

让我们以此为例

df <- read.table(header = TRUE, 
                   stringsAsFactors = FALSE, 
                   text="GENE   SYMBOL          Patient1   Patient2   
                   TP53         ILMN_2            3.55        3.66
                   TP53         ILMN_3            5.49        4.99
                   XBP1         ILMN_5            4.06        2.53
                   TP27         ILMN_1            2.53        3.33
                   REDD1        ILMN_4            3.99        4.56
                   ERO1L        ILMN_6            5.02        6.95
                   STK11        ILMN_9            3.64        2.01
                   HIF2A        ILMN_8            2.96        4.76 ")

为了绘制来自df的选定基因,我通常会做以下事情:

首先,我创建一个可用于在数据框中搜索的对象

SYMBOL_info <- select(df, SYMBOL)

然后,我将我感兴趣的基因定义为:

library(dplyr)
library(tidyr)
library(ggplot2)

geneOfInterest <- c(SYMBOL_info == "5")

接下来,在数据框中找到感兴趣的基因,并收集数据框以符合ggplots要求:

df_gather<- df %>%
  filter(geneOfInterest) %>% 
  gather(key=Patient, value=values, -c(GENE, SYMBOL))

最后,绘制了数据集中感兴趣的基因:

ggplot()+
  geom_point(df_gather, mapping = aes(x=Patient, y=values, color=GENE))+
  labs(title="XBP1 plot", subtitle = "Symbol: 5")+
  ggsave("XBP1_plot.png")

然而,我有许多我想要绘制的基因,例如: TP53,REDD1,STK11和HIF1A的两个版本。有关如何做到这一点的任何建议,而无需每次都更改geneOfInterest以及在代码的绘图部分中的信息?我想一个for循环需要进行,但是复制这里给出的其他解决方案对我没有帮助(如下所示:R: saving multiple ggplots using a for loop)。

提前致谢! :)

编辑:SYMBOL值更改为以ILMN_开头,而不仅仅是数字

2 个答案:

答案 0 :(得分:2)

根据您想要绘制的基因和数据的数量,我建议使用这样的方面在一个图中绘制所有内容:

df %>% 
  filter(Gene %in% c("TP53", "ERO1L", "HIF2A")) %>% 
  gather(key, value, -Gene, -SYMBOL) %>% 
  ggplot(aes(key, value, fill=Gene))+
    geom_col()+
    facet_wrap(~Gene+ SYMBOL, labeller = label_both)

enter image description here

否则试试这个:

sapply(c(2,3,9), function(x){
  geneOfInterest <- df[ df$SYMBOL == x, 1]
  df %>%
   filter(SYMBOL == x) %>% 
   gather(key=Patient, value=values, -Gene,-SYMBOL) %>% 
   ggplot(aes(x=Patient, y=values, color=Gene))+
    geom_point()+
    labs(title="XBP1 plot", subtitle = "Symbol: 5") + 
    ggsave(paste0(geneOfInterest, "_plot.png"))
})

答案 1 :(得分:0)

谢谢,Jimbou!

我只想补充一点,我将你建议的功能改为此(在剧情和文件名中包括Gene和Symbol):

sapply(c(2,5,9), function(x){
  geneOfInterest <- df[ df$SYMBOL == x, 1]
  df %>%
    filter(SYMBOL == x) %>% 
    gather(key=Patient, value=values, -GENE,-SYMBOL) %>% 
    ggplot(aes(x=Patient, y=values, color=GENE))+
    geom_point()+
    labs(title=paste0(symbolOfInterest, " plot"), subtitle =paste0("Symbol: ", x)) + 
    ggsave(paste0(geneOfInterest,"_symbol_",x, "_plot.png"))
})