我有一个密度图,我想添加一些摘要信息,例如在中位数放置一条线并遮蔽90%可信区间(第5和第95分位数)。有没有办法在ggplot中这样做?
这是我想总结的情节类型:
我可以弄清楚如何从y = 0到y =密度(中位数(x))绘制一条线,但是我不清楚我是否可以用90%CI对阴影进行着色。或者,我可以在密度图上方添加一个水平箱图,但不清楚如何自动旋转箱图,而不用随之旋转密度图。
x <- as.vector(rnorm(10000))
d <- as.data.frame(x=x)
library(ggplot2)
ggplot(data = d) + theme_bw() +
geom_density(aes(x=x, y = ..density..), color = 'black')
答案 0 :(得分:16)
您可以使用geom_area()函数。首先使用density()函数显示密度。
x <- as.vector(rnorm(10000))
d <- as.data.frame(x=x)
library(ggplot2)
p <- ggplot(data = d) + theme_bw() +
geom_density(aes(x=x, y = ..density..), color = 'black')
# new code is below
q5 <- quantile(x,.05)
q95 <- quantile(x,.95)
medx <- median(x)
x.dens <- density(x)
df.dens <- data.frame(x = x.dens$x, y = x.dens$y)
p + geom_area(data = subset(df.dens, x >= q5 & x <= q95),
aes(x=x,y=y), fill = 'blue') +
geom_vline(xintercept = medx)
答案 1 :(得分:4)
我想在@Prasad Chalasani的回答中为那些想要添加所有3个标准区域的人提供答案。 1 Std是最暗的阴影,2 Std是中间阴影,3 Std是最亮的阴影。平均值是黑线,中位数是白线。
set.seed(501) # Make random sample reproducible
x <- as.vector(rnorm(100))
d <- as.data.frame(x=x)
library(ggplot2)
p <- ggplot(data=d) +
theme_bw() +
geom_density(aes(x=x, y = ..density..), color = '#619CFF')
# new code is below
q15.9 <- quantile(x, .159) # 1 Std 68.2%
q84.1 <- quantile(x, .841)
q2.3 <- quantile(x, .023) # 2 Std 95.4%
q97.7 <- quantile(x, .977)
q0.01 <- quantile(x, .001) # 3 Std 99.8%
q99.9 <- quantile(x, .999)
meanx <- mean(x)
medx <- median(x)
x.dens <- density(x)
df.dens <- data.frame(x=x.dens$x, y=x.dens$y)
p + geom_area(data = subset(df.dens, x >= q15.9 & x <= q84.1), # 1 Std 68.2%
aes(x=x,y=y), fill='#619CFF', alpha=0.8) +
geom_area(data = subset(df.dens, x >= q2.3 & x <= q97.7), # 2 Std 95.4%
aes(x=x,y=y), fill='#619CFF', alpha=0.6) +
geom_area(data = subset(df.dens, x >= q0.01 & x <= q99.9), # 3 Std 99.8%
aes(x=x,y=y), fill='#619CFF', alpha=0.3) +
geom_vline(xintercept=meanx) +
geom_vline(xintercept=medx, color='#FFFFFF')
答案 2 :(得分:3)
这(也)在中位数处做垂直线:
ggplot(data = d) + theme_bw() +
geom_density(aes(x=x, y = ..density..), color = 'black') +
geom_line(aes(x=median(x), y=c(0,.4) ) )