我用python编写了一个代码来检测数据集中的奇异点。为了检测峰,我必须设置阈值T
,但这是针对一个数据样本的,这意味着我必须更改每个新数据的阈值。关于如何改进代码以自动计算阈值(代码中的T
)的任何想法都可以使用标准偏差,速率变化或类似的方法。
总而言之,我希望从数据集中自动计算T
(这是峰值检测的阈值),而不是尝试一些随机值。
谢谢
tab = np.array(data).astype(str).astype(np.float)
aux=tab[0][0]
index=[]
index.append(0)
i=1
while i <= len(tab)-2:
while ( ((tab[i][0]>aux+T) or (tab[i][0]<aux-T))
aux=tab[i][0]
SP.append(aux)
index.append(i)
break
i=i+1
.
.
.