提取分布密集部分的最小值和最大值的最佳方法是什么?

时间:2014-03-25 03:38:34

标签: algorithm

我有一个到平行线的点距离分布。每个分布都有一个更加填充的区域,代表点通道。我想提取图中红线代表的最小值和最大值?眼睛可以很容易地做到,但如何用算法强有力地做到这一点?

x轴表示点到线的垂直距离,从0到100米。

y轴表示在某个箱子中具有距离的点数。

示例1

Find boundaries

示例2

Find boundaries

1 个答案:

答案 0 :(得分:1)

由于分布来自从点到线的一组距离,并且值是有序的,因此您可以尝试计算为样本建模的正态分布。从那里,得到边距(你的红色条)平均值+/- x * sigma,其中x可以是你想要的值(可能是1或2)。

如果这些点不合适,您可能会将完整值列表中的某个百分位数(例如0.25)作为阈值,并假设您的填充部分从那里开始,其值高于该百分位数。