如何在Python中提取语音数据信号的包络?

时间:2018-12-22 12:23:25

标签: python algorithm filter speech-recognition tensor

我设法将一个句子(wav文件)分解为wav格式的孤立原始单词,并将其读取为numpy数组。以下是有关我使用plt.plot命令时每个单词的外观的示例。enter image description here

每个单词都以一个numpy数组表示,您可以:1.高度压缩[20000 vales],并且2.高频噪声很大。

我想提取该信号的包络线(一条连续的曲线),使其与信号的峰值点重合,然后将该数组发送到张量图。

我尝试了一种粗鲁的方法,并得到了这个:enter image description here

我可以使用任何过滤器,还是可以帮助我设计一个函数来查找信封?

0 个答案:

没有答案