标签: python algorithm filter speech-recognition tensor
我设法将一个句子(wav文件)分解为wav格式的孤立原始单词,并将其读取为numpy数组。以下是有关我使用plt.plot命令时每个单词的外观的示例。
每个单词都以一个numpy数组表示,您可以:1.高度压缩[20000 vales],并且2.高频噪声很大。
我想提取该信号的包络线(一条连续的曲线),使其与信号的峰值点重合,然后将该数组发送到张量图。
我尝试了一种粗鲁的方法,并得到了这个:
我可以使用任何过滤器,还是可以帮助我设计一个函数来查找信封?