我有一个长度为15,000的数据集,实际值从0到100.我的数据集是HEAVILY向左倾斜。我正在尝试完成以下容器:0,1,2,3,4,5,6,7,8,9,10,> 10。到目前为止我所做的是创建如下:
breakvector = c(0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 100)
并且已经运行:
hist(datavector, breaks=breakvector, xlim=(0, 13))
然而,似乎这会产生直方图,其中不包括大于13的数据。有没有人知道如何让R在最后一个bin中包含所有其余数据。提前致谢。
答案 0 :(得分:2)
这个怎么样
datavector<-c(sample(1:9, 40, replace=T), sample(10:100, 20, replace=T))
breakvector <- c(0:11)
hist(ifelse(datavector>10,11,datavector), breaks=breakvector, xlim=c(0, 13), xaxt="n")
axis(1, at=1:11-.5, labels=c(1:10, ">10"))
不是调整中断,而是将所有值>10
抛出到11的bin中。然后我相应地更新轴。