将局部最大值区分为峰值的一部分和峰值的绝对最大值

时间:2013-07-31 13:23:29

标签: python python-2.7 detection maxima

我从mp3的10秒剪辑中获取了振幅数据。然后,我对其执行了快速傅里叶变换,以获得频域中剪辑的数据(如第一幅图所示)。我现在想确定峰值的频率。

Amplitude to Frequency

我从平滑数据开始,这可以在下面的蓝色和红色图中看到。我创建了一个阈值,峰值必须结束才能被考虑。这是下面第三张图中的水平蓝线。可以看出,我的峰值检测代码在某种程度上起作用。

Smoothing and peak detection

我现在遇到的问题在下面显示的最终情节中很明显。我的代码发现最大值是局部最大值,作为整体峰值的一部分。我需要一种方法来过滤掉这些局部最大值,这样对于每个峰值,我只得到一个标记。即对于下面显示的峰值,我只想要一个绝对峰值的标记,而不是沿途的每个小峰值。

Enlarged view of peak detection

我的峰值检测代码如下所示:

for i, item in enumerate(xavg): #xavg contains all the smoothed data points
    if xavg[i] > threshold: #points must be above the threshold
        #if not the first or last point (so index isn't out of range)            
        if (i > 0) and (i < (len(xavg)-1)): 
            #greater than points on either side                
            if (xavg[i] > xavg[i-1]) and (xavg[i] > xavg[i+1]):  
                max_locations.append(i)
编辑:我想我没有说清楚我的问题。我想在图上找到5个左右最高尖峰的位置,而不仅仅是整体的最高点。我基本上试图通过标记其主要频率来为剪辑提供音频指纹。

EDIT2:还有一些代码可以帮助展示我在FFT和平滑方面所做的工作:

def movingaverage(interval, window_size):
    window = np.ones(int(window_size))/float(window_size)
    return np.convolve(interval, window, 'same')

fft = np.fft.rfft(song)
xavg = movingaverage(abs(fft), 21)

4 个答案:

答案 0 :(得分:1)

您的值可以划分为交替的超阈值和欠阈值区域。当您找到局部最大值时,请跟踪哪一个最大,直到您的值再次低于阈值。将“区域”最大值设置为真正的峰值,然后继续下一个超阈值区域。类似的东西:

# Store the true peaks
peaks = []

# If you consider the first value a possible local maxima.
# Otherwise, just initialize max_location to (None, 0)
if xavg[0] > xavg[1]:
    max_location = (0, xavg[0])
else:
    max_location = (None,0) # position and value

# Use a slice to skip the first and last items.
for i, item in enumerate(xavg[1:-1]):
    if xavg[i] > threshold:
        if ((xavg[i] > xavg[i-1]) and
            (xavg[i] > xavg[i+1]) and
            xavg[i] > max_location[1]):
            max_location = (i, xavg[i])
    else:
        # If we found a previous largest local maxima, save it as a true
        # peak, then reset the values until the next time we exceed the threshold
        if max_location[0] is not None:
            peaks.append(max_location[0])
        max_location = None
        max_location_value = 0

# Do you consider the last value a possible maximum?
if xavg[i+1] > xavg[i] and xavg[i+1] > max_location[1]:
    max_location = (i+1, xavg[i+1])

# Check one last time if the last point was over threshold.
if max_location[0] is not None:
    peaks.append(max_location[0])

答案 1 :(得分:0)

您当前正在制作前一个点和下一个点低于当前点的任何点的列表(max_locations)。如果你只对绝对最大值感兴趣,你可以这样做:

xavg.index(MAX(xavg [指定startPosition:终端位置]))

或者,如果您希望保持代码不变,您可以在将自身置于max_location位置之前检查当前点是否大于任何其他点:

如果xavg [i]&gt; xavg [max_location]:     max_location = i

答案 2 :(得分:0)

有很多关于此的文献。从我的头脑中你至少有四个选择。我特别推荐选项2和3。

  • 根据chepner的建议,考虑到您的峰值是相同的,直到它低于您的阈值。
  • 或者,如果您认为在再次上升(双峰值)之前可能有一个峰值不会低于阈值,则可以计算FFT的导数。因此,当峰值低于阈值或者导数变为零(峰值之间的谷值)时,您将其称为明显的峰值。
  • 高斯人或洛伦兹人说,你总能适应你的高峰。这可能是我提到的最有力的方法。
  • 您确定最高峰,保存它并移除它周围的N个点(N = 3,4,5,...您选择),然后找到第二个峰值,并删除它周围相同数量的点。 ..

答案 3 :(得分:0)

高峰发现非常棘手,如果可能的话,我会避免尝试实现自己的代码。尝试使用scipy.signal.find_peaks_cwt,您可以使用一些参数。使用此功能,我认为您不需要事先平滑数据,因为其中一个参数基本上是一个长度列表,用于平滑数据。粗略地说,算法在一个长度尺度上平滑数据,寻找峰值,在另一个长度尺度上平滑,寻找峰值等等。然后它查找出现在所有或大多数长度尺度的峰值。