我有2个情节,每个都显示不同类型的数据(疫苗和疾病),我想提取这些情节的片段以生成每个受试者的情节,其中包含疫苗和疾病,根据原始情节着色。
vac
subject age vaccine
1 E11 1.0 DTaP-IPV
2 E11 3.0 DTaP-IPV
3 E22 1.0 DTaP-IPV
4 E22 2.0 Rota
5 E22 3.0 DTaP-IPV
6 E22 3.3 Rota
ill
subject age illness
1 E11 0.5 ear infection
2 E11 2.0 ear infection
3 E22 0.8 fever
4 E22 1.2 fever
5 E22 3.0 ear infection
ggplot(vac,aes(x=age,y=subject,color=vaccine))+geom_point(size=5) +
scale_color_brewer(palette="Set1",drop = FALSE)+facet_grid(subject~.)
ggplot(ill,aes(x=age,y=subject,color=illness))+geom_point(size=5) +
scale_color_brewer(palette="Set3",drop = FALSE)+facet_grid(subject~.)
现在,我希望E11有一个数字,有一排疫苗(用Set1颜色着色)和一排疾病(用Set3颜色着色),对于E22也是如此。
我有很多数据类型,约有40个主题,所以当然,我希望这是自动完成的,而不是通过插图画家等。
我认为gtable是要走的路,但不知道如何提取一个方面。
非常感谢!
答案 0 :(得分:1)
这是一个快速的解决方案,可以帮助您朝着正确的方向前进。试一试。
require(reshape2)
require(plyr)
dat <- melt(join(vac, ill, type="full"), id.vars = c("subject", "age"), na.rm=TRUE)
ggplot(dat, aes(x=age,y=variable, color=value))+geom_point(size=5) +
scale_color_brewer(palette="Set1",drop = FALSE)+facet_grid(subject~.)
答案 1 :(得分:1)
以下代码将vac
和ill
合并为一个数据框(添加新变量type
以区分疫苗和疾病),这将使我们能够绘制疾病和疫苗只需拨打一次ggplot
即可。代码有点笨拙,但我希望它能让你更接近你正在寻找的东西。
library(RColorBrewer)
library(gridExtra)
# Combine data frames vac and ill by adding a new column
# called "type" and changing name of the third column to "condition"
vac$type = "Vaccine"
names(vac)[3] = "condition"
ill$type = "Illness"
names(ill)[3] = "condition"
dat = rbind(vac, ill)
# Convert condition to a factor to get the levels ordered properly
dat$condition = factor(dat$condition,
levels=c(unique(dat$condition[dat$type=="Vaccine"]),
unique(dat$condition[dat$type=="Illness"])))
dat
subject age condition type
1 E11 0.5 ear infection Illness
2 E11 2.0 ear infection Illness
3 E22 3.0 ear infection Illness
4 E22 0.8 fever Illness
5 E22 1.2 fever Illness
6 E11 1.0 DTaP-IPV Vaccine
7 E11 3.0 DTaP-IPV Vaccine
8 E22 1.0 DTaP-IPV Vaccine
9 E22 3.0 DTaP-IPV Vaccine
10 E22 2.0 Rota Vaccine
11 E22 3.3 Rota Vaccine
现在我们为每个主题生成一个图表,将每个图表放在一个列表中,然后将所有图表保存在一个PDF文件中。 ggplot
代码的工作原理如下:
subject
构成,以便我们获得带有主题ID的条带。type
构成,以便我们获得疾病和疫苗的单独图表。 pal1 = c(brewer.pal(n=3, name="Set1")[1:2],
brewer.pal(n=3, name="Set3")[1:2])
p = list()
for (i in unique(dat$subject)) {
p[[i]] = ggplot(dat[dat$subject==i,],
aes(x=age, y=condition, colour=condition)) +
geom_point(size=5) +
scale_color_manual(values=pal1, drop=FALSE) +
facet_grid(type ~ subject, scale="free") + ylab("") +
guides(colour=FALSE)
}
pdf("plots.pdf", 9,5)
do.call("grid.arrange", p)
dev.off()
以下是图表:
答案 2 :(得分:1)
在您在问题中创建的方面中,对于不在构面中的主题,您有空行。有大约40个主题,这将创建一个填充行和39个空行的面,这可能不是你想要的。
另一种解决方案:
# merging the dataframes together
dat <- merge(vac, ill, by=c("subject","age"), all=TRUE, sort=TRUE)
# creating the plot
ggplot() +
geom_point(data=dat[!is.na(dat$vaccine),], aes(x=age, y=subject, fill=vaccine), size=10, shape=22) +
geom_point(data=dat[!is.na(dat$illness),], aes(x=age, y=subject, color=illness), size=7, shape=17) +
scale_fill_brewer(palette="Set1") +
scale_color_brewer(palette="Set2") +
theme_bw()
给出: