我有6000份报告。对于每份报告,我都知道报告中有多少垃圾。所以我可以做一个直方图:
boundaries = seq(0,1 , by=0.01)
hist(hoeveel_rommel_per_rapport, breaks=boundaries)
其中hoeveel_rommel_per_rapport
是描述每个报告的垃圾的向量。
现在,每个报告都有一个群集编号。我想在直方图中为所有簇提供不同的颜色。这可能吗?
例如,第一个堆栈包含3个不同的簇,因此它有3种颜色。
答案 0 :(得分:2)
我倾向于使用ggplot
来做这样的事情。以下是使用组合数据的一些方法(将来,您应该提供您的数据,或者至少是代表性的样本)。
set.seed(1) # for reproducible example
reports <- data.frame(garbage=rchisq(900,c(10,15,20))/50,cluster=LETTERS[1:3])
这看起来就像你要找的那样 - 堆积直方图。
library(ggplot2)
ggplot(reports) +
geom_histogram(aes(x=garbage, fill=cluster),binwidth=0.01)
这将三个直方图放在不同的面板中 - 更加清晰。
ggplot(reports) +
geom_histogram(aes(x=garbage, fill=cluster),binwidth=0.01) +
facet_wrap(~cluster,nc=1)
在一个面板中重叠密度图。
ggplot(reports) +
stat_density(aes(x=garbage, fill=cluster),position="identity",alpha=0.5)
答案 1 :(得分:0)
您可以使用您想要的颜色传递参数col
,我不确定是否通过传递像col = c("green", "red", "blue")
这样的颜色列表会做你想要的颜色,但你当然可以选择哪种颜色做他们有