Question

我有数据，我想在直方图中显示4个因子的每个子集内的频率。我希望他们使用相同的直方图和不同的颜色。 ..ncount ..函数看起来是最好的，但它将数据规范化为最大值1，而我希望子集中所有频率的SUM等于1.这是我的代码使用和附图：

我的数据文件是：“assocID” 因素是：“类别” 我用于直方图的连续变量是：“QGM”

ggplot(assocID,aes(QGM)) + 
    geom_histogram(binwidth=0.1,aes(fill=category,y(..count..)),position="dodge") +
    facet_wrap(~dyad)

转到here查看三个输出图像。我是一个新的用于stackoverflow，所以他们不会让我发布图像。我认为图表的解释比文本更好！

现在，如果我使用(..count..)/sum(..count..)除以总计数，而不是在子集

中

ggplot(assocID,aes(QGM)) + 
    geom_histogram(binwidth=0.1,aes(fill=category,y(..count..)/sum(..count..)),position="dodge") + 
    facet_wrap(~dyad)

最后，ncount似乎也没有这样做。

ggplot(assocID,aes(QGM)) + 
    geom_histogram(binwidth=0.1,aes(fill=category,y(..ncount..)),position="dodge") + 
    facet_wrap(~dyad)

基本上我想在变量“category”的每个因子中显示频率的直方图

非常感谢任何帮助！

Answer 1

这很难，因为您的示例不具有可重现性，但我会抓住您正在寻找的..density..，stat_bin y(..count..)会产生一个值y = ..count..整合到一个。

另外，我假设{{1}}的目的是{{1}}？