我有一个大的数据集,其中包含蛋白质ID和相应的丰度谱,包含许多凝胶分数。我想在这些分数中绘制这些丰度的概况。
数据看起来像这样
IDs<- c("prot1", "prot2", "prot3", "prot4")
fraction1 <- c(3,4,2,4)
fraction2<- c(1,2,4,1)
fraction3<- c(6,4,6,2)
plotdata<-data.frame(IDs, fraction1, fraction2, fraction3)
> plotdata
IDs fraction1 fraction2 fraction3
1 prot1 3 1 6
2 prot2 4 2 4
3 prot3 2 4 6
4 prot4 4 1 2
每种蛋白质都有一个特征。每个部分每个蛋白质具有相应的丰度值。我希望每个情节都有多种蛋白质。
我尝试使用备忘单找出ggplot2但失败了。我不知道输入df应该是什么样的,以及我应该用什么方法来获取这些配置文件。
我会使用excel,但是根据数据的顺序,错误会导致我的数据的错误轮廓,所以我不相信它可以做我想要的。
答案 0 :(得分:2)
首先,您必须重新组织ggplot2的data.frame。您可以使用reshape2::melt
执行此操作。在这里你可以改变&#39;变量&#39;和&#39;价值&#39;名。
library(reshape2)
library(dplyr)
library(ggplot2)
data2 <- melt(plotdata, id.vars = "IDs")
然后,我们按蛋白质对数据进行分组:
data2 <- group_by(data2, IDs)
最后,你可以很简单地绘制它:
ggplot(data2) +
geom_line(aes(variable, value, group = IDs,
color = IDs))