从ggplot中提取一个方面

时间:2014-09-29 16:24:33

标签: r ggplot2 gtable

我有2个情节,每个都显示不同类型的数据(疫苗和疾病),我想提取这些情节的片段以生成每个受试者的情节,其中包含疫苗和疾病,根据原始情节着色

vac
  subject age  vaccine
1     E11 1.0 DTaP-IPV
2     E11 3.0 DTaP-IPV
3     E22 1.0 DTaP-IPV
4     E22 2.0     Rota
5     E22 3.0 DTaP-IPV
6     E22 3.3     Rota

ill
  subject age       illness
1     E11 0.5 ear infection
2     E11 2.0 ear infection
3     E22 0.8         fever
4     E22 1.2         fever
5     E22 3.0 ear infection

ggplot(vac,aes(x=age,y=subject,color=vaccine))+geom_point(size=5) +
  scale_color_brewer(palette="Set1",drop = FALSE)+facet_grid(subject~.)

OnlyVaccines

ggplot(ill,aes(x=age,y=subject,color=illness))+geom_point(size=5) +
  scale_color_brewer(palette="Set3",drop = FALSE)+facet_grid(subject~.)

OnlyFever

现在,我希望E11有一个数字,有一排疫苗(用Set1颜色着色)和一排疾病(用Set3颜色着色),对于E22也是如此。

我有很多数据类型,约有40个主题,所以当然,我希望这是自动完成的,而不是通过插图画家等。

我认为gtable是要走的路,但不知道如何提取一个方面。

非常感谢!

3 个答案:

答案 0 :(得分:1)

这是一个快速的解决方案,可以帮助您朝着正确的方向前进。试一试。

require(reshape2)
require(plyr)
dat <- melt(join(vac, ill, type="full"), id.vars = c("subject", "age"), na.rm=TRUE)

ggplot(dat, aes(x=age,y=variable, color=value))+geom_point(size=5) +
  scale_color_brewer(palette="Set1",drop = FALSE)+facet_grid(subject~.)

答案 1 :(得分:1)

以下代码将vacill合并为一个数据框(添加新变量type以区分疫苗和疾病),这将使我们能够绘制疾病和疫苗只需拨打一次ggplot即可。代码有点笨拙,但我希望它能让你更接近你正在寻找的东西。

library(RColorBrewer)
library(gridExtra)

# Combine data frames vac and ill by adding a new column 
# called "type" and changing name of the third column to "condition"
vac$type = "Vaccine"
names(vac)[3] = "condition"

ill$type = "Illness"
names(ill)[3] = "condition"

dat = rbind(vac, ill)

# Convert condition to a factor to get the levels ordered properly
dat$condition = factor(dat$condition, 
                       levels=c(unique(dat$condition[dat$type=="Vaccine"]), 
                                unique(dat$condition[dat$type=="Illness"])))

dat
   subject age     condition    type
1      E11 0.5 ear infection Illness
2      E11 2.0 ear infection Illness
3      E22 3.0 ear infection Illness
4      E22 0.8         fever Illness
5      E22 1.2         fever Illness
6      E11 1.0      DTaP-IPV Vaccine
7      E11 3.0      DTaP-IPV Vaccine
8      E22 1.0      DTaP-IPV Vaccine
9      E22 3.0      DTaP-IPV Vaccine
10     E22 2.0          Rota Vaccine
11     E22 3.3          Rota Vaccine

现在我们为每个主题生成一个图表,将每个图表放在一个列表中,然后将所有图表保存在一个PDF文件中。 ggplot代码的工作原理如下:

  • subject构成,以便我们获得带有主题ID的条带。
  • type构成,以便我们获得疾病和疫苗的单独图表。
  • 使用下面创建的调色板获取我们想要的颜色

pal1 = c(brewer.pal(n=3, name="Set1")[1:2], brewer.pal(n=3, name="Set3")[1:2])

p = list() 
for (i in unique(dat$subject)) { 
  p[[i]] = ggplot(dat[dat$subject==i,], 
                  aes(x=age, y=condition, colour=condition)) +
    geom_point(size=5) + 
    scale_color_manual(values=pal1, drop=FALSE) + 
    facet_grid(type ~ subject, scale="free") + ylab("") + 
   guides(colour=FALSE) 
}

pdf("plots.pdf", 9,5)
do.call("grid.arrange", p)  
dev.off()

以下是图表: enter image description here

答案 2 :(得分:1)

在您在问题中创建的方面中,对于不在构面中的主题,您有空行。有大约40个主题,这将创建一个填充行和39个空行的面,这可能不是你想要的。

另一种解决方案:

# merging the dataframes together
dat <- merge(vac, ill, by=c("subject","age"), all=TRUE, sort=TRUE)

# creating the plot
ggplot() +
  geom_point(data=dat[!is.na(dat$vaccine),], aes(x=age, y=subject, fill=vaccine), size=10, shape=22) +
  geom_point(data=dat[!is.na(dat$illness),], aes(x=age, y=subject, color=illness), size=7, shape=17) +
  scale_fill_brewer(palette="Set1") +
  scale_color_brewer(palette="Set2") +
  theme_bw()

给出: enter image description here