r histogram为每个bin分配错误的观察数

时间:2014-09-17 13:31:57

标签: r count histogram frequency

以下是我正在使用的数据。我做一个简单的hist(数据),-.3到.4的频率是正确的。然而,出于某种原因,R似乎结合了-.5和-.4的频率,两个最左边的箱子。有3个-.5和5个计数-.4,但R计算了8个-.5和-.4的计数。

知道为什么会这样吗?如何解决?

  [1] -0.1  0.0  0.1  0.1  0.3  0.0  0.0  0.1  0.1  0.1  0.2  0.1 -0.1  0.2  0.0
 [16] -0.4  0.2  0.0 -0.1  0.0  0.1  0.1 -0.1  0.0  0.0  0.1  0.0 -0.1  0.0  0.3
 [31] -0.2  0.4 -0.1  0.0 -0.2  0.0  0.1  0.1  0.0  0.1  0.2 -0.1  0.1  0.1 -0.1
 [46]  0.2  0.1 -0.1  0.1  0.0 -0.1  0.4 -0.1 -0.1  0.0  0.0 -0.1  0.1  0.1  0.0
 [61]  0.1 -0.1  0.2 -0.1  0.1 -0.1  0.0  0.1  0.0  0.1  0.0  0.1  0.0 -0.1  0.1
 [76]  0.2 -0.2  0.0  0.0 -0.1  0.2  0.0  0.0  0.0 -0.3  0.0 -0.1 -0.1  0.1 -0.2
 [91] -0.1 -0.3 -0.1 -0.3 -0.2 -0.2  0.0  0.0  0.0 -0.2  0.1  0.0  0.0  0.1  0.0
[106]  0.0 -0.2 -0.1  0.2 -0.1  0.0 -0.1 -0.1 -0.2  0.1  0.1  0.0  0.1  0.2  0.1
[121]  0.0  0.1 -0.2  0.2  0.0  0.0  0.1  0.1  0.0 -0.1  0.1  0.0  0.1 -0.1  0.2
[136]  0.0  0.1  0.1  0.0  0.1 -0.1  0.0  0.0  0.1  0.2 -0.1  0.1  0.0  0.1  0.0
[151] -0.1  0.0  0.2  0.1 -0.1  0.1 -0.2  0.1  0.1 -0.1  0.1 -0.2 -0.1  0.1 -0.1
[166]  0.0  0.0 -0.3  0.0  0.1 -0.2  0.1 -0.4 -0.2 -0.2 -0.3  0.0 -0.4 -0.3 -0.5
[181] -0.5 -0.5 -0.4 -0.3 -0.4 -0.1  0.0 -0.1 -0.2 -0.2  0.1  0.0  0.2 -0.1 -0.1
[196]  0.0  0.3  0.2 -0.1  0.0  0.0  0.0 -0.3  0.4  0.3  0.1  0.0 -0.1  0.1 -0.1
[211]  0.1  0.0  0.0  0.2  0.2  0.1  0.3 -0.1  0.1  0.0  0.0  0.0  0.0  0.1  0.3
[226]  0.0  0.0 -0.1  0.0  0.2  0.2  0.0  0.0  0.0  0.2  0.1  0.0  0.0  0.2  0.3
[241]  0.1 -0.1  0.0  0.4  0.0  0.2 -0.1  0.1

这是直方图的输出。您可以看到8个-.5和-.4的计数,这些计数不在数据

$breaks
 [1] -0.5 -0.4 -0.3 -0.2 -0.1  0.0  0.1  0.2  0.3  0.4

$counts
 [1]  8  8 17 46 75 60 23  7  4

1 个答案:

答案 0 :(得分:0)

上面的评论解释了发生了什么 - 休息是间隔的左右限制,而不是中心。

如何解决?如果你只处理离散化为[自然数] * 0.1的数字,你可以将你的休息时间设置为0.05,0.15,......

data <- c(-0.5, -0.5, 0.4) 
breaks <- ((min(data)*10):(max(data)*10+1))/10-0.05
result <- hist(data, breaks)

但直方图真的是你需要的吗?您似乎只想通过

计算出现次数更容易
data <- c(-0.5, -0.5, 0.4) 
aggregate(data, list(data), "length")

返回

  Group.1 x
1    -0.4 2
2     0.6 1

如需绘图,请查看barplot