假设我有以下数据集:
set.seed(seed=10)
n <- 10000
s.data <- data.frame(score = rnorm(n,500,100),
gender = sample(c("Male","Female"),size=n,replace=T,prob=c(.4,.6)),
major = sample(c("A","B","C","D"),size=n,replace=T,prob=c(.02,.25,.05,.68)))
我创建了以下直方图:
require(ggplot2)
ggplot(s.data, aes(x=score)) + facet_wrap(~ major) +
geom_histogram(binwidth=50,colour="black", fill="white")
由于我想了解关于主要A和C的更多细节,我绘制了一个密度直方图:
ggplot(s.data, aes(x=score)) + facet_wrap(~ major) +
geom_histogram(binwidth=50,aes(y = ..density..),colour="black", fill="white")
完美到现在为止。
当我尝试用分类变量(而不是连续变量)做同样的事情时,我能够做频率但无法绘制密度:
ggplot(s.data, aes(gender)) +
geom_histogram(colour="black", fill="white") +
facet_wrap(~ major)
我想要的。
但我不知道这张图:
ggplot(s.data, aes(gender)) +
geom_histogram(aes(y = ..density..),colour="black", fill="white") +
facet_wrap(~ major)
有什么想法吗? 提前谢谢。