密度/频率和概率()

时间:2015-09-14 11:45:43

标签: r histogram

我使用过代码

hist(x, probability=TRUE)

给出了一个0到2的y轴,名称密度。我不明白这意味着什么。它是否积分为1,总和为1,或者y值等于什么?文档说" freq = NULL,probability =!freq"但这对我没有意义。如果我不使用probability = TRUE,我会在y轴上获得频率,但绘图的形状是相同的。

1 个答案:

答案 0 :(得分:2)

您可以将直方图保存到变量并查看它。

x=rnorm(1000)
h<-hist(x)

enter image description here

h

$breaks
 [1] -3.5 -3.0 -2.5 -2.0 -1.5 -1.0 -0.5  0.0  0.5  1.0  1.5  2.0  2.5  3.0  3.5  4.0

$counts
 [1]   2   8  24  42  87 169 188 189 146  78  38  23   5   0   1

$density
 [1] 0.004 0.016 0.048 0.084 0.174 0.338 0.376 0.378 0.292 0.156 0.076 0.046 0.010 0.000 0.002

$mids
 [1] -3.25 -2.75 -2.25 -1.75 -1.25 -0.75 -0.25  0.25  0.75  1.25  1.75  2.25  2.75  3.25  3.75

$xname
[1] "x"

$equidist
[1] TRUE

attr(,"class")
[1] "histogram"

默认情况下,它绘制频率(可以通过h $计数访问),这只是每个间隔内的点数。点总数等于矢量的长度,您可以使用

进行检查
sum(h$counts)
[1] 1000

如果指定probability=TRUE,它将绘制每个点在每个间隔内的概率。概率乘以条的宽度的总和应该等于1.在我们的例子中,条宽是0.5,所以我们得到

sum(h$density*0.5)
[1] 1