我从mp3的10秒剪辑中获取了振幅数据。然后,我对其执行了快速傅里叶变换,以获得频域中剪辑的数据(如第一幅图所示)。我现在想确定峰值的频率。
我从平滑数据开始,这可以在下面的蓝色和红色图中看到。我创建了一个阈值,峰值必须结束才能被考虑。这是下面第三张图中的水平蓝线。可以看出,我的峰值检测代码在某种程度上起作用。
我现在遇到的问题在下面显示的最终情节中很明显。我的代码发现最大值是局部最大值,作为整体峰值的一部分。我需要一种方法来过滤掉这些局部最大值,这样对于每个峰值,我只得到一个标记。即对于下面显示的峰值,我只想要一个绝对峰值的标记,而不是沿途的每个小峰值。
我的峰值检测代码如下所示:
for i, item in enumerate(xavg): #xavg contains all the smoothed data points
if xavg[i] > threshold: #points must be above the threshold
#if not the first or last point (so index isn't out of range)
if (i > 0) and (i < (len(xavg)-1)):
#greater than points on either side
if (xavg[i] > xavg[i-1]) and (xavg[i] > xavg[i+1]):
max_locations.append(i)
编辑:我想我没有说清楚我的问题。我想在图上找到5个左右最高尖峰的位置,而不仅仅是整体的最高点。我基本上试图通过标记其主要频率来为剪辑提供音频指纹。
EDIT2:还有一些代码可以帮助展示我在FFT和平滑方面所做的工作:
def movingaverage(interval, window_size):
window = np.ones(int(window_size))/float(window_size)
return np.convolve(interval, window, 'same')
fft = np.fft.rfft(song)
xavg = movingaverage(abs(fft), 21)
答案 0 :(得分:1)
您的值可以划分为交替的超阈值和欠阈值区域。当您找到局部最大值时,请跟踪哪一个最大,直到您的值再次低于阈值。将“区域”最大值设置为真正的峰值,然后继续下一个超阈值区域。类似的东西:
# Store the true peaks
peaks = []
# If you consider the first value a possible local maxima.
# Otherwise, just initialize max_location to (None, 0)
if xavg[0] > xavg[1]:
max_location = (0, xavg[0])
else:
max_location = (None,0) # position and value
# Use a slice to skip the first and last items.
for i, item in enumerate(xavg[1:-1]):
if xavg[i] > threshold:
if ((xavg[i] > xavg[i-1]) and
(xavg[i] > xavg[i+1]) and
xavg[i] > max_location[1]):
max_location = (i, xavg[i])
else:
# If we found a previous largest local maxima, save it as a true
# peak, then reset the values until the next time we exceed the threshold
if max_location[0] is not None:
peaks.append(max_location[0])
max_location = None
max_location_value = 0
# Do you consider the last value a possible maximum?
if xavg[i+1] > xavg[i] and xavg[i+1] > max_location[1]:
max_location = (i+1, xavg[i+1])
# Check one last time if the last point was over threshold.
if max_location[0] is not None:
peaks.append(max_location[0])
答案 1 :(得分:0)
您当前正在制作前一个点和下一个点低于当前点的任何点的列表(max_locations)。如果你只对绝对最大值感兴趣,你可以这样做:
xavg.index(MAX(xavg [指定startPosition:终端位置]))
或者,如果您希望保持代码不变,您可以在将自身置于max_location位置之前检查当前点是否大于任何其他点:
如果xavg [i]&gt; xavg [max_location]: max_location = i
答案 2 :(得分:0)
有很多关于此的文献。从我的头脑中你至少有四个选择。我特别推荐选项2和3。
答案 3 :(得分:0)
高峰发现非常棘手,如果可能的话,我会避免尝试实现自己的代码。尝试使用scipy.signal.find_peaks_cwt,您可以使用一些参数。使用此功能,我认为您不需要事先平滑数据,因为其中一个参数基本上是一个长度列表,用于平滑数据。粗略地说,算法在一个长度尺度上平滑数据,寻找峰值,在另一个长度尺度上平滑,寻找峰值等等。然后它查找出现在所有或大多数长度尺度的峰值。