如何将数据分组为自然出现的“容器”

时间:2018-08-21 16:27:55

标签: c# arrays statistics data-analysis mathnet

我应使用哪种方法将以下内容分类为自然出现的“垃圾箱”。

   double[] x = { 18, 18, 18, 18, 19, 20, 20, 20, 21, 22, 22, 23, 24,  
      26, 27, 32, 33, 49, 52, 56,900,1200, 1200, 1500, 2000, 2000,2200,2200 };

我已经查看了“离群值”,“五分位数”的各种代码,但不确定采用哪种方法。

如果它变得更容易,我正在使用C#,并且可能会利用Linq或其他方法来做到这一点。

在我的情况下,我想创建两个完全不同的数字集的“箱”,例如:

  • NumbersLessThan56
  • NumbersGreaterThan900

我想用数学方法计算的是Bin1和Bin2之间有很大的“ x的倍数”间隙。

我正在与MathNet进行实验,以找到导数拐点,但是仍然可以弄清楚这一点

1 个答案:

答案 0 :(得分:0)

您可能希望针对此类问题查看“ Jenks natural breaks optimization”,请参见。 1D Number Array Clustering