你能否建议numpy / scipy的模块函数可以在1D numpy数组中找到局部最大值/最小值?显然,最简单的方法是查看最近的邻居,但我希望有一个可接受的解决方案,这是numpy发行版的一部分。
答案 0 :(得分:190)
在SciPy> = 0.11
import numpy as np
from scipy.signal import argrelextrema
x = np.random.random(12)
# for local maxima
argrelextrema(x, np.greater)
# for local minima
argrelextrema(x, np.less)
制作
>>> x
array([ 0.56660112, 0.76309473, 0.69597908, 0.38260156, 0.24346445,
0.56021785, 0.24109326, 0.41884061, 0.35461957, 0.54398472,
0.59572658, 0.92377974])
>>> argrelextrema(x, np.greater)
(array([1, 5, 7]),)
>>> argrelextrema(x, np.less)
(array([4, 6, 8]),)
注意,这些是x的索引,是本地最大/最小值。要获取值,请尝试:
>>> x[argrelextrema(x, np.greater)[0]]
scipy.signal
还提供了argrelmax
和argrelmin
,分别用于查找最大值和最小值。
答案 1 :(得分:54)
如果您要查找的1d数组中的所有条目a
小于其邻居,您可以尝试
numpy.r_[True, a[1:] < a[:-1]] & numpy.r_[a[:-1] < a[1:], True]
在此步骤之前,您还可以numpy.convolve()
使用{{1}}。{/ p>
我认为没有专门的功能。
答案 2 :(得分:34)
对于没有太多噪音的曲线,我建议使用以下小代码片段:
from numpy import *
# example data with some peaks:
x = linspace(0,4,1e3)
data = .2*sin(10*x)+ exp(-abs(2-x)**2)
# that's the line, you need:
a = diff(sign(diff(data))).nonzero()[0] + 1 # local min+max
b = (diff(sign(diff(data))) > 0).nonzero()[0] + 1 # local min
c = (diff(sign(diff(data))) < 0).nonzero()[0] + 1 # local max
# graphical output...
from pylab import *
plot(x,data)
plot(x[b], data[b], "o", label="min")
plot(x[c], data[c], "o", label="max")
legend()
show()
+1
很重要,因为diff
会减少原始索引号。
答案 3 :(得分:18)
另一种方法(更多的话,更少的代码)可能会有所帮助:
局部最大值和最小值的位置也是一阶导数的过零点的位置。找到零交叉通常比直接找到局部最大值和最小值要容易得多。
不幸的是,一阶导数倾向于“放大”噪声,因此当原始数据中存在显着噪声时,只有在原始数据应用了一定程度的平滑之后才能最好地使用一阶导数。
由于平滑在最简单的意义上是低通滤波器,因此使用卷积内核进行平滑通常是最好的(很好,最容易),并且“整形”内核可以提供惊人的特征保留量/增强能力。找到最佳内核的过程可以使用各种方法自动完成,但最好的方法可能是简单的强力(很快找到小内核)。一个好的内核会(按预期)大量扭曲原始数据,但它不会影响感兴趣的峰/谷的位置。
幸运的是,通常可以通过简单的SWAG(“有根据的猜测”)创建合适的内核。平滑内核的宽度应该比原始数据中最宽的预期“有趣”峰值宽一些,并且其形状将类似于该峰值(单级小波)。对于保持平均值的内核(任何好的平滑滤波器应该是什么),内核元素的总和应该精确地等于1.00,并且内核应该关于其中心对称(意味着它将具有奇数个元素。
给定最佳平滑内核(或针对不同数据内容优化的少量内核),平滑程度成为卷积内核(“增益”)的缩放因子。
确定“正确”(最佳)平滑度(卷积核增益)甚至可以自动化:将一阶导数数据的标准偏差与平滑数据的标准偏差进行比较。两个标准偏差的比率如何随平滑度的变化而变化,可用于预测有效平滑值。一些手动数据运行(真正具有代表性)应该是所有需要的。
上面发布的所有先前解决方案都计算了一阶导数,但它们并未将其视为统计测量,上述解决方案也没有尝试执行特征保留/增强平滑(以帮助微妙的峰值“超越”噪声)。
最后,坏消息:当噪音也具有看起来像真正的峰值(重叠带宽)的特征时,找到“真实”峰值会成为皇家的痛苦。下一个更复杂的解决方案通常是使用更长的卷积核(“更宽的核孔径”),其考虑相邻“实际”峰值之间的关系(例如峰值出现的最小或最大速率),或者使用多个卷积通过使用具有不同宽度的内核(但只有当它更快时:基本的数学事实是,顺序执行的线性卷积总是可以卷积成单个卷积)。但是,通常更容易找到一系列有用的内核(宽度不同)并将它们组合在一起,而不是直接在一个步骤中找到最终的内核。
希望这提供足够的信息让谷歌(也许是一个好的统计数据)填补空白。我真的希望我有时间提供一个有用的例子,或一个链接。如果有人在网上遇到一个,请在这里发布!
答案 4 :(得分:8)
为什么不使用Scipy内置函数signal.find_peaks_cwt来完成这项工作?
from scipy import signal
import numpy as np
#generate junk data (numpy 1D arr)
xs = np.arange(0, np.pi, 0.05)
data = np.sin(xs)
# maxima : use builtin function to find (max) peaks
max_peakind = signal.find_peaks_cwt(data, np.arange(1,10))
# inverse (in order to find minima)
inv_data = 1/data
# minima : use builtin function fo find (min) peaks (use inversed data)
min_peakind = signal.find_peaks_cwt(inv_data, np.arange(1,10))
#show results
print "maxima", data[max_peakind]
print "minima", data[min_peakind]
结果:
maxima [ 0.9995736]
minima [ 0.09146464]
此致
答案 5 :(得分:5)
<强>更新强>
我对渐变感到不满意,所以我发现使用numpy.diff
更可靠。如果它符合你的要求,请告诉我。
关于噪声问题,数学问题是如果我们想要查看噪声,我们可以使用像前面提到的卷积这样的噪声来定位最大值/最小值。
import numpy as np
from matplotlib import pyplot
a=np.array([10.3,2,0.9,4,5,6,7,34,2,5,25,3,-26,-20,-29],dtype=np.float)
gradients=np.diff(a)
print gradients
maxima_num=0
minima_num=0
max_locations=[]
min_locations=[]
count=0
for i in gradients[:-1]:
count+=1
if ((cmp(i,0)>0) & (cmp(gradients[count],0)<0) & (i != gradients[count])):
maxima_num+=1
max_locations.append(count)
if ((cmp(i,0)<0) & (cmp(gradients[count],0)>0) & (i != gradients[count])):
minima_num+=1
min_locations.append(count)
turning_points = {'maxima_number':maxima_num,'minima_number':minima_num,'maxima_locations':max_locations,'minima_locations':min_locations}
print turning_points
pyplot.plot(a)
pyplot.show()
答案 6 :(得分:5)
从SciPy 1.1版开始,您还可以使用find_peaks。以下是两个来自文档本身的示例。
使用height
参数,可以选择高于某个阈值的所有最大值(在此示例中,所有非负最大值;如果必须处理嘈杂的基线,这可能非常有用;如果需要)要找到最小值,只需将您的输入乘以-1
):
import matplotlib.pyplot as plt
from scipy.misc import electrocardiogram
from scipy.signal import find_peaks
import numpy as np
x = electrocardiogram()[2000:4000]
peaks, _ = find_peaks(x, height=0)
plt.plot(x)
plt.plot(peaks, x[peaks], "x")
plt.plot(np.zeros_like(x), "--", color="gray")
plt.show()
另一个非常有用的参数是distance
,它定义了两个峰之间的最小距离:
peaks, _ = find_peaks(x, distance=150)
# difference between peaks is >= 150
print(np.diff(peaks))
# prints [186 180 177 171 177 169 167 164 158 162 172]
plt.plot(x)
plt.plot(peaks, x[peaks], "x")
plt.show()
答案 7 :(得分:4)
虽然这个问题真的很老了。我相信在numpy(一个班轮)中有一个更简单的方法。
import numpy as np
list = [1,3,9,5,2,5,6,9,7]
np.diff(np.sign(np.diff(list))) #the one liner
#output
array([ 0, -2, 0, 2, 0, 0, -2])
为了找到局部最大值或最小值,我们基本上想要找到列表中的值(3-1,9-3 ......)之间的差异从正变为负(最大)或从负变为正(最小) )。因此,首先我们找到差异。然后我们找到符号,然后通过再次获取差异来找到符号的变化。 (类似于微积分中的一阶和二阶导数,只有我们有离散数据且没有连续函数。)
我的示例中的输出不包含extrema(列表中的第一个和最后一个值)。此外,就像微积分一样,如果二阶导数是负数,那么你有最大值,如果它是正数,你就有一个最小值。
因此我们有以下比赛:
[1, 3, 9, 5, 2, 5, 6, 9, 7]
[0, -2, 0, 2, 0, 0, -2]
Max Min Max
答案 8 :(得分:3)
这些解决方案都不适用于我,因为我想在重复值的中心找到峰值。例如,在
中 ar = np.array([0,1,2,2,2,1,3,3,3,2,5,0])
答案应该是
array([ 3, 7, 10], dtype=int64)
我是用循环做的。我知道它不是超级干净,但它完成了工作。
def findLocalMaxima(ar):
# find local maxima of array, including centers of repeating elements
maxInd = np.zeros_like(ar)
peakVar = -np.inf
i = -1
while i < len(ar)-1:
#for i in range(len(ar)):
i += 1
if peakVar < ar[i]:
peakVar = ar[i]
for j in range(i,len(ar)):
if peakVar < ar[j]:
break
elif peakVar == ar[j]:
continue
elif peakVar > ar[j]:
peakInd = i + np.floor(abs(i-j)/2)
maxInd[peakInd.astype(int)] = 1
i = j
break
peakVar = ar[i]
maxInd = np.where(maxInd)[0]
return maxInd
答案 9 :(得分:1)
import numpy as np
x=np.array([6,3,5,2,1,4,9,7,8])
y=np.array([2,1,3,5,3,9,8,10,7])
sortId=np.argsort(x)
x=x[sortId]
y=y[sortId]
minm = np.array([])
maxm = np.array([])
i = 0
while i < length-1:
if i < length - 1:
while i < length-1 and y[i+1] >= y[i]:
i+=1
if i != 0 and i < length-1:
maxm = np.append(maxm,i)
i+=1
if i < length - 1:
while i < length-1 and y[i+1] <= y[i]:
i+=1
if i < length-1:
minm = np.append(minm,i)
i+=1
print minm
print maxm
minm
和maxm
分别包含最小值和最大值的索引。对于一个庞大的数据集,它将提供大量的最大值/最小值,因此在这种情况下首先平滑曲线然后应用此算法。
答案 10 :(得分:1)
另一种使用膨胀运算符的解决方案:
import numpy as np
from scipy.ndimage import rank_filter
def find_local_maxima(x):
x_dilate = rank_filter(x, -1, size=3)
return x_dilate == x
以及最小值:
def find_local_minima(x):
x_erode = rank_filter(x, -0, size=3)
return x_erode == x
此外,您可以从scipy.ndimage
中将rank_filter(x, -1, size=3)
替换为grey_dilation
,将rank_filter(x, 0, size=3)
替换为grey_erosion
。不需要本地排序,因此速度更快。
答案 11 :(得分:0)
另一个:
def local_maxima_mask(vec):
"""
Get a mask of all points in vec which are local maxima
:param vec: A real-valued vector
:return: A boolean mask of the same size where True elements correspond to maxima.
"""
mask = np.zeros(vec.shape, dtype=np.bool)
greater_than_the_last = np.diff(vec)>0 # N-1
mask[1:] = greater_than_the_last
mask[:-1] &= ~greater_than_the_last
return mask