我应使用哪种方法将以下内容分类为自然出现的“垃圾箱”。
double[] x = { 18, 18, 18, 18, 19, 20, 20, 20, 21, 22, 22, 23, 24,
26, 27, 32, 33, 49, 52, 56,900,1200, 1200, 1500, 2000, 2000,2200,2200 };
我已经查看了“离群值”,“五分位数”的各种代码,但不确定采用哪种方法。
如果它变得更容易,我正在使用C#,并且可能会利用Linq或其他方法来做到这一点。
在我的情况下,我想创建两个完全不同的数字集的“箱”,例如:
我想用数学方法计算的是Bin1和Bin2之间有很大的“ x的倍数”间隙。
我正在与MathNet进行实验,以找到导数拐点,但是仍然可以弄清楚这一点
答案 0 :(得分:0)
您可能希望针对此类问题查看“ Jenks natural breaks optimization”,请参见。 1D Number Array Clustering。