audio - 使用OpenSMILE从实时输入中提取音频功能

时间：2014-01-14 16:10:31

标签： audio feature-extraction

我可以使用OpenSMILE从存储在系统中的音频文件中提取功能。但我需要使用相同的OpenSMILE实时提取功能。是否可以，而不保存录制的音频文件？

答案 0 :(得分：1)

似乎它可能会支持它。来自manual

检查您的SMILExtract二进制文件是否支持实时录音和播放，输入： SMILExtract -H cPortaudio

和

组件cPortaudioSource和cPortaudioSink可用作替换cWaveSource和cWaveSink。他们生产/期望数据与wave组件的格式相同。

万岁互联网搜索...

答案 1 :(得分：1)

您可能还需要一个cTurnDetector组件（请参阅http://opensmile.audeering.com/中引用的SIG'MM教程）和一个VAD，以便为某些功能（功能）启用实时输入的分段。

另请查看：How to create custom config files in OpenSMILE，了解如何自定义配置文件并正确设置缓冲区大小（在实时模式下，使用环形缓冲区以避免增加内存消耗非常重要。）

答案 2 :(得分：0)

如果使用portAudio :)

构建openSMILE，它可以正常工作

根据手册：

...提供了一个实时特征提取示例 从输入中捕获实时音频并提取韵律特征（音高和响度轮廓）。功能将保存为CSV文件。要使用此配置，请键入：

SMILExtract -C config / liveProsodyAcf.conf