我必须使用直方图绘制一些数据。我的数据介于[0,1]之间,任何特定点都没有大的浓度。
样本数与箱数(长度相等)之间的比率是多少?
答案 0 :(得分:4)
我通常使用样本数的平方根作为二进制数。这是Wikipedia histogram article中适当数量的箱子讨论中列出的最简单的选择。来自这篇文章
没有“最佳”数量的垃圾箱,不同的垃圾箱尺寸可以揭示数据的不同特征。一些理论家试图确定最佳的箱数,但这些方法通常会对分布的形状做出强有力的假设。
如果您不想对数据的分布做出假设,那么使用样本数的平方根通常是一个很好的起点。