标签: audio feature-extraction
我正在尝试使用OpenSmile作为特征提取器(使用emobase2010.conf),并对这些特征进行一些分类。
我很好奇的是,是否可以使用已经列出的音频流作为输入(我正在使用ROS通信来获取音频流)。
在openSMILE手册中,只有使用.wav作为输入的示例。
或者除了使用openSMILE之外,是否还可以从音频中提取1582个功能(例如emobase2010.conf)?