什么是定义值的样本间隔更有效和准确的算法?

时间:2011-04-24 10:07:30

标签: algorithm histogram

Excel,Matplotlib,matlab,R等可以绘制直方图。在许多情况下,我们必须将原始大样本更改为一组间隔.Wiki说我们有不同的算法来完成这项任务,但最受欢迎的是平方根选择article in wiki。在文本中我没有看到这个声明的证据。所以我的问题是:算法最适合这项任务吗? 你有什么建议可以阅读这个问题?

1 个答案:

答案 0 :(得分:2)

如果你想得到第二意见,并且有更彻底的理由,请尝试Izenman的“现代多变量统计技术......”第4.3节。对于正态分布的特殊情况,他提出了一个宽度为3.4908 * sigma * n ^( - 1/3)的bin宽度,这与维基百科中的Freedman-Diacontis选择非常接近。

然而,Izenman还表明,对于他最优化产生这个bin宽度的度量,直方图与其他估算器相比确实非常糟糕,所以我建议如果你准备努力工作以获得尽可能好的估计,首先从直方图更改为核密度估算器(Izenman和http://en.wikipedia.org/wiki/Kernel_density_estimation的第4.5节)