R:直方图中的聚类

时间:2014-11-17 09:14:38

标签: r histogram clustered-index

我有6000份报告。对于每份报告,我都知道报告中有多少垃圾。所以我可以做一个直方图:

boundaries = seq(0,1 , by=0.01) 
hist(hoeveel_rommel_per_rapport, breaks=boundaries)

其中hoeveel_rommel_per_rapport是描述每个报告的垃圾的向量。 enter image description here

现在,每个报告都有一个群集编号。我想在直方图中为所有簇提供不同的颜色。这可能吗?

例如,第一个堆栈包含3个不同的簇,因此它有3种颜色。

2 个答案:

答案 0 :(得分:2)

我倾向于使用ggplot来做这样的事情。以下是使用组合数据的一些方法(将来,您应该提供您的数据,或者至少是代表性的样本)。

set.seed(1)   # for reproducible example
reports <- data.frame(garbage=rchisq(900,c(10,15,20))/50,cluster=LETTERS[1:3])

这看起来就像你要找的那样 - 堆积直方图。

library(ggplot2)
ggplot(reports) +
  geom_histogram(aes(x=garbage, fill=cluster),binwidth=0.01)

这将三个直方图放在不同的面板中 - 更加清晰。

ggplot(reports) +
  geom_histogram(aes(x=garbage, fill=cluster),binwidth=0.01) +
  facet_wrap(~cluster,nc=1)

在一个面板中重叠密度图。

ggplot(reports) +
  stat_density(aes(x=garbage, fill=cluster),position="identity",alpha=0.5)

答案 1 :(得分:0)

您可以使用您想要的颜色传递参数col,我不确定是否通过传递像col = c("green", "red", "blue")这样的颜色列表会做你想要的颜色,但你当然可以选择哪种颜色做他们有