Question

我有一个大的数据集，其中包含蛋白质ID和相应的丰度谱，包含许多凝胶分数。我想在这些分数中绘制这些丰度的概况。

数据看起来像这样

IDs<- c("prot1", "prot2", "prot3", "prot4")
fraction1 <- c(3,4,2,4)
fraction2<- c(1,2,4,1)
fraction3<- c(6,4,6,2)
plotdata<-data.frame(IDs, fraction1, fraction2, fraction3)

> plotdata
    IDs  fraction1  fraction2  fraction3
1 prot1          3          1          6
2 prot2          4          2          4
3 prot3          2          4          6
4 prot4          4          1          2

我希望它看起来像这样：

每种蛋白质都有一个特征。每个部分每个蛋白质具有相应的丰度值。我希望每个情节都有多种蛋白质。

我尝试使用备忘单找出ggplot2但失败了。我不知道输入df应该是什么样的，以及我应该用什么方法来获取这些配置文件。

我会使用excel，但是根据数据的顺序，错误会导致我的数据的错误轮廓，所以我不相信它可以做我想要的。

Answer 1

首先，您必须重新组织ggplot2的data.frame。您可以使用reshape2::melt执行此操作。在这里你可以改变＆＃39;变量＆＃39;和＆＃39;价值＆＃39;名。

library(reshape2)
library(dplyr)
library(ggplot2)
data2 <- melt(plotdata, id.vars = "IDs")

然后，我们按蛋白质对数据进行分组：

data2 <- group_by(data2, IDs)

最后，你可以很简单地绘制它：

ggplot(data2) +
    geom_line(aes(variable, value, group = IDs,
                  color = IDs))

如何使用ggplot2在R中绘制配置文件

1 个答案: