我可以使用OpenSMILE从存储在系统中的音频文件中提取功能。但我需要使用相同的OpenSMILE实时提取功能。是否可以,而不保存录制的音频文件?
答案 0 :(得分:1)
似乎它可能会支持它。来自manual
检查您的SMILExtract二进制文件是否支持实时录音和 播放,输入:
SMILExtract -H cPortaudio
和
组件cPortaudioSource和cPortaudioSink可用作 替换cWaveSource和cWaveSink。他们生产/期望数据 与wave组件的格式相同。
万岁互联网搜索...
答案 1 :(得分:1)
您可能还需要一个cTurnDetector组件(请参阅http://opensmile.audeering.com/中引用的SIG'MM教程)和一个VAD,以便为某些功能(功能)启用实时输入的分段。
另请查看:How to create custom config files in OpenSMILE,了解如何自定义配置文件并正确设置缓冲区大小(在实时模式下,使用环形缓冲区以避免增加内存消耗非常重要。)
答案 2 :(得分:0)
如果使用portAudio :)
构建openSMILE,它可以正常工作根据手册:
...提供了一个实时特征提取示例 从输入中捕获实时音频并提取韵律特征(音高和响度轮廓)。 功能将保存为CSV文件。要使用此配置,请键入:
SMILExtract -C config / liveProsodyAcf.conf