我在R中的直方图功能上遇到了麻烦。
我有一个数据集,其中包含每组中的个体数,值的范围为0到17。 我想将它们划分为类别(0-4、5-9、10-14等),因为这很公平,因为每个类别都包含5个数字。
但是,当我在R中使用hist
函数时,它会自动归类为0-5、6-10、11-15等,这不是我想要的。
我在直方图函数中尝试了“ seq”和“ break”,但对我来说效果不佳。
您有什么想法/建议可以帮助管理我的直方图?您是否认为可以使用0-4、5-9等,还是您认为R处理我的数据正确吗?
我不想拆分成任何较小的容器,因为我想对数据进行卡方检验,并且类别过多会导致期望值较小。
hist(data,main="Histogram", xlab = "individuals",
ylab ="Count", border="black", col="red", xlim=c(0,20), ylim=c(0,10))
Set Individuals
1 2
2 5
3 9
4 6
5 17
6 2
7 13
8 6
9 0
10 1
11 2
12 1
13 2
14 2
15 15
答案 0 :(得分:0)
您可以使用hist函数中的breaks
参数来配置垃圾箱。您需要提供一个列表,其中包含更改的值。因此,如果您有整数,并且希望具有0-4、5-9 ...,则可以使用(此处的数据介于0到10之间):
> seq(-0.5, max(data)+5, 5)
[1] -0.5 4.5 9.5 14.5
然后选择其他任意参数:
hist(data, breaks=seq(-0.5,max(data)+5,5))