使用OpenSMILE从实时输入中提取音频功能

时间:2014-01-14 16:10:31

标签: audio feature-extraction

我可以使用OpenSMILE从存储在系统中的音频文件中提取功能。但我需要使用相同的OpenSMILE实时提取功能。是否可以,而不保存录制的音频文件?

3 个答案:

答案 0 :(得分:1)

似乎它可能会支持它。来自manual

  

检查您的SMILExtract二进制文件是否支持实时录音和   播放,输入:   SMILExtract -H cPortaudio

  

组件cPortaudioSource和cPortaudioSink可用作   替换cWaveSource和cWaveSink。他们生产/期望数据   与wave组件的格式相同。

万岁互联网搜索...

答案 1 :(得分:1)

您可能还需要一个cTurnDetector组件(请参阅http://opensmile.audeering.com/中引用的SIG'MM教程)和一个VAD,以便为某些功能(功能)启用实时输入的分段。

另请查看:How to create custom config files in OpenSMILE,了解如何自定义配置文件并正确设置缓冲区大小(在实时模式下,使用环形缓冲区以避免增加内存消耗非常重要。)

答案 2 :(得分:0)

如果使用portAudio :)

构建openSMILE,它可以正常工作

根据手册:

...提供了一个实时特征提取示例 从输入中捕获实时音频并提取韵律特征(音高和响度轮廓)。 功能将保存为CSV文件。要使用此配置,请键入:

SMILExtract -C config / liveProsodyAcf.conf