如果我有一些通用数据。
dx <- data.frame(x = c(sample(letters[1:4], 1000, replace=TRUE)),
y = c(sample(letters[5:7], 1000, replace=TRUE)),
z = c(sample(1:10, 5000, replace=TRUE)))
dx$z <- as.factor(dx$z)
d <- ggplot(dx, aes(z, fill=z)) +
geom_bar() +
facet_grid(y~x)
d
我想在每个网格元素(ae,be,af等)中打印每个z
百分比。
如果我尝试使用geom_text( ... aes(label = paste(round(..count../sum(..count..)*100),"%"))
我将百分比作为总Z
的函数根据我的阅读,在绘图之前计算百分比更容易。
我尝试使用此question中使用的ddply
函数
但它改变了我的数据长度。其中
m = ddply(data.frame(table(df)), .(x, y), mutate, pct = round(Freq/sum(Freq) * 100, 1))
尝试绘制
d <- ggplot(dx,
aes(z, fill =z)) +
geom_bar() +
facet_grid(y ~ x)+
geom_text(position = "identity", aes(label = paste(round(m$pct), "%")),
color = "black", y = 40) +
scale_x_discrete(drop=F)
给我错误
Error: Aesthetics must either be length one, or the same length as the dataProblems:paste(round(m$pct), "%")
非常感谢任何帮助,无论是geom_text
内的命令还是使用ddply
答案 0 :(得分:2)
从你所关联的问题中带头:
您还需要将ddply
返回的新数据帧与美学一起传递给geom_text
。
library(ggplot2)
library(plyr)
# Reduced the dataset
set.seed(1)
dx <- data.frame(x = sample(letters[1:2], 1000, replace=TRUE),
y = sample(letters[5:6], 1000, replace=TRUE),
z = factor(sample(1:3, 5000, replace=TRUE)))
# Your ddply call
m <- ddply(data.frame(table(dx)), .(x,y), mutate,
pct = round(Freq/sum(Freq) * 100, 0))
# Plot - with a little extra y-axis space for the label
d <- ggplot(dx, aes(z, fill=z)) +
geom_bar() +
scale_y_continuous(limits=c(0, 1.1*max(m$Freq))) +
facet_grid(y~x)
d + geom_text(data=m, aes(x=z, y=Inf, label = paste0(pct, "%")),
vjust = 1.5, size = 5)
(我认为这只是显示N(%)的大量墨水,特别是如果你有很多方面和z的水平)
答案 1 :(得分:1)
不太确定你的z意味着什么,但是这个在网格上增加了百分比,直到1。
require(plyr)
helper<-sum(dx$z)
datac <- ddply(dx, c("x","y"), summarise, zshare=sum(z)/helper)
dx$z <- as.factor(dx$z)
d <- ggplot(data=dx)
d <- d + geom_bar(aes(z, fill=z))
d <- d+ facet_grid(y~x) + geom_text(data=datac,aes(x=3,y=60,label=paste(round(zshare,3)*100,"%")))
d