有人可以解释如何估算ggplot documentation中的示例图形吗?
因此,正如我在描述中所读到的,使用geom_density()
的估计是核密度估计。虽然,核密度估计被构造成一个概率测量,但图形的面积显然不是1,而是约为5。
有人可以描述图形背后的数学吗?
答案 0 :(得分:0)
图表的总面积并不意味着什么。垂直轴从0到1 的事实意味着什么。
该图表根据carat
的值显示每个类别的条件概率。
例如,让我们carat = 1
。在这里,ideal
钻石占据了大部分垂直空间,如大粉红色区域所示。相反,fair
钻石仅占一小部分,如红色/橙色小区域所示。所以我们可以说更多1克拉的钻石可能比公平的更理想。现在让我们来carat = 5
。在这里,红色/橙色区域占据所有垂直空间,所有其他类别可忽略不计。这意味着(几乎)所有5克拉的钻石都是公平的。
(和Y轴标签"计数"不是很好;它应该更像"概率"。)