有多少箱子给出了一些数据

时间:2012-08-21 13:18:33

标签: plot matplotlib histogram bin binning

我必须使用直方图绘制一些数据。我的数据介于[0,1]之间,任何特定点都没有大的浓度。

样本数与箱数(长度相等)之间的比率是多少?

1 个答案:

答案 0 :(得分:4)

我通常使用样本数的平方根作为二进制数。这是Wikipedia histogram article中适当数量的箱子讨论中列出的最简单的选择。来自这篇文章

  

没有“最佳”数量的垃圾箱,不同的垃圾箱尺寸可以揭示数据的不同特征。一些理论家试图确定最佳的箱数,但这些方法通常会对分布的形状做出强有力的假设。

如果您不想对数据的分布做出假设,那么使用样本数的平方根通常是一个很好的起点。