如何使用ggplot2在R中绘制配置文件

时间:2018-01-26 11:12:42

标签: r

我有一个大的数据集,其中包含蛋白质ID和相应的丰度谱,包含许多凝胶分数。我想在这些分数中绘制这些丰度的概况。

数据看起来像这样

IDs<- c("prot1", "prot2", "prot3", "prot4")
fraction1 <- c(3,4,2,4)
fraction2<- c(1,2,4,1)
fraction3<- c(6,4,6,2)
plotdata<-data.frame(IDs, fraction1, fraction2, fraction3)

> plotdata
    IDs  fraction1  fraction2  fraction3
1 prot1          3          1          6
2 prot2          4          2          4
3 prot3          2          4          6
4 prot4          4          1          2

我希望它看起来像这样:a plot made in excel of protein abundances

每种蛋白质都有一个特征。每个部分每个蛋白质具有相应的丰度值。我希望每个情节都有多种蛋白质。

我尝试使用备忘单找出ggplot2但失败了。我不知道输入df应该是什么样的,以及我应该用什么方法来获取这些配置文件。

我会使用excel,但是根据数据的顺序,错误会导致我的数据的错误轮廓,所以我不相信它可以做我想要的。

1 个答案:

答案 0 :(得分:2)

首先,您必须重新组织ggplot2的data.frame。您可以使用reshape2::melt执行此操作。在这里你可以改变&#39;变量&#39;和&#39;价值&#39;名。

library(reshape2)
library(dplyr)
library(ggplot2)
data2 <- melt(plotdata, id.vars = "IDs")

然后,我们按蛋白质对数据进行分组:

data2 <- group_by(data2, IDs)

最后,你可以很简单地绘制它:

ggplot(data2) +
    geom_line(aes(variable, value, group = IDs,
                  color = IDs))