根据密度过滤数组

时间:2012-11-27 13:21:52

标签: php python arrays algorithm filter

我有一个样本图,如下面的..,我用数组X中的(x,y)值集合绘制。

http://bubblebird.com/images/t.png

正如您所见,图像的密集峰值介于4000到5100之间

我的确切问题是我能以编程方式找到图表最密集的范围吗?
ie .. 使用数组X如何找到此图表密集的范围?
对于这个数组,它将是4000 - 5100。

为简单起见,假设阵列只有一个密集区域。
如果您可以推荐伪代码/代码,请感谢。

3 个答案:

答案 0 :(得分:5)

您可以在移动窗口上使用信号的方差。 下面是一个示例(参见附图,其中测试信号为红色,窗口方差为绿色,滤波后的信号为蓝色):

simple example

测试信号生成:

import numpy as np
X = np.arange(200) - 100.  
Y = (np.exp(-(X/10)**2) + np.exp(-((np.abs(X)-50.)/2)**2)/3.) * np.cos(X * 10.)

计算移动窗口差异:

window_length = 30 # number of point for the window
variance = np.array([np.var(Y[i-window_length / 2.: i+window_length/2.]) for i in range(200)])

得到方差高的指数(这里我选择的标准方差优于最大方差的一半......你可以根据你的情况调整它):

idx = np.where(variance > 0.5 * np.max(variance))

X_min = np.min(X[idx])
# -14.0
X_max = np.max(X[idx])
# 15.0

或过滤信号(将方差低的点设为零)

Y_modified = np.where(variance > 0.5 * np.max(variance), Y, 0)

答案 1 :(得分:4)

您可以计算相邻值之间的绝对差值,然后可以使用滑动窗口稍微平滑一些,然后找到平滑的绝对差值为最大值的50%的区域。

使用python(你在标签中有python),这将是这样的:

a = ( 10, 11, 9, 10, 18, 5, 20, 6, 15, 10, 9, 11 )

diffs = [abs(i[0]-i[1]) for i in zip(a,a[1:])]
# [1, 2, 1, 8, 13, 15, 14, 9, 5, 1, 2]
maximum = max(diffs)
# 15
result = [i>maximum/2 for i in diffs]
# [False, False, False, True, True, True, True, True, False, False, False]

答案 2 :(得分:0)

您可以使用分类算法(例如k-means)将数据拆分成聚类并找到加权最多的聚类