从音频信号中提取特征

时间:2019-02-11 21:14:11

标签: python librosa

我刚刚开始处理音频形式的数据。我正在使用librosa作为工具。我的项目要求我提取以下功能:

  • 音频的总时长
  • 音频信号的最小强度
  • 音频信号的最大强度
  • 音频信号的平均强度
  • 抖动
  • 说话率
  • 暂停次数
  • 最长暂停时间
  • 平均停顿时间
  • 总暂停时间

尽管我知道这些术语,但是我不知道如何从音频文件中提取这些术语。这些以某种形式内置在librosa.feature变量中吗?还是我们需要手动计算这些?有人可以指导我如何进行吗?

我知道可以使用Praat之类的软件来执行此工作,但是我需要使用python来完成。

  

Praat可用于频谱分析(频谱图),音高   分析,共振峰分析,强度分析,抖动,闪光和   声音中断。

0 个答案:

没有答案