我目前正在处理具有许多数据点的大型生物数据集。 R中的Head()函数为我提供了以下列名:
强度-样本-空缺-研究-Dx
强度是唯一的数字数据。其他都是角色。
首先,我将所有数据都分解为以下df:unfactordata。接下来,我有兴趣制作一个特定数据子集的散点图,我将使用以下代码段进行处理,然后在它们之间尝试使用geom_smooth行对其进行散点图。我使用以下代码:
scatplotprot <- function(name){
proteinname <- subset(unfactordata, Acession == name)
p <- ggplot(data = proteinname, aes(x = Dx, y = intensity, color = Study)) +
geom_point() +
geom_smooth(method = 'lm', aes(group = Dx))
return(p)
}
这确实给了我一个散点图,其中所有强度值位于2组(Dx)之间,并且根据数据点源自哪个研究而进行了着色。但是,它不会显示两组(Dx)之间的线。我希望根据所调用的Acession看到3到8行。
希望任何人都可以帮助我解决这个希望很小的问题。
最温暖的
帕特里克