我使用过代码
hist(x, probability=TRUE)
给出了一个0到2的y轴,名称密度。我不明白这意味着什么。它是否积分为1,总和为1,或者y值等于什么?文档说" freq = NULL,probability =!freq"但这对我没有意义。如果我不使用probability = TRUE,我会在y轴上获得频率,但绘图的形状是相同的。
答案 0 :(得分:2)
您可以将直方图保存到变量并查看它。
x=rnorm(1000)
h<-hist(x)
h
$breaks
[1] -3.5 -3.0 -2.5 -2.0 -1.5 -1.0 -0.5 0.0 0.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0
$counts
[1] 2 8 24 42 87 169 188 189 146 78 38 23 5 0 1
$density
[1] 0.004 0.016 0.048 0.084 0.174 0.338 0.376 0.378 0.292 0.156 0.076 0.046 0.010 0.000 0.002
$mids
[1] -3.25 -2.75 -2.25 -1.75 -1.25 -0.75 -0.25 0.25 0.75 1.25 1.75 2.25 2.75 3.25 3.75
$xname
[1] "x"
$equidist
[1] TRUE
attr(,"class")
[1] "histogram"
默认情况下,它绘制频率(可以通过h $计数访问),这只是每个间隔内的点数。点总数等于矢量的长度,您可以使用
进行检查sum(h$counts)
[1] 1000
如果指定probability=TRUE
,它将绘制每个点在每个间隔内的概率。概率乘以条的宽度的总和应该等于1.在我们的例子中,条宽是0.5,所以我们得到
sum(h$density*0.5)
[1] 1