使用openSMILE音频特征提取器来表示功能集

时间:2017-03-31 12:39:39

标签: audio cmd frameworks feature-extraction feature-selection

我的问题是在一个示例.wav文件中取不同帧中的所有功能。我在“chroma_fft.conf”文件中尝试cFunctionals,该文件属于最新的OpenEar框架。为了得到最好的解释,我正在编写这些基本代码,我在“chroma_fft.conf”中写了它,如下所示;

[componentInstances:cComponentManager]
instance[functL1].type = cFunctionals

[functL1:cFunctional]
reader.dmLevel = chroma
writer.dmLevel = func 
frameMode = full
frameSize=0
frameStep=0
functionalsEnabled = Means
Means.amean = 1

[csvSink:cCsvSink]
reader.dmLevel = func
..NOT-IMPORTANT......
..NOT-IMPORTANT......

然而,当我在Windows中从命令提示符运行时,我得到了错误; configManager中的“(错误)[1]:在configmanager中找不到字段'functL1.reader.dmInstance'的基本实例!”

非常相似的代码从“emo_large.conf”成功运行,但此代码出错。如果任何机构知道如何使用OpenSmile音频特征提取器,可以给出建议或回答它为什么有错误以及如何正确使用“cFunctionals”来获取大型特征集的均值,方差,矩等。

谢谢!

1 个答案:

答案 0 :(得分:0)

在这种情况下,你有一个拼写错误

[functL1:cFunctional]

应该是

[functL1:cFunctional <强>取值

我承认错误消息

configManager中的

“(ERROR)[1]:在configmanager中找不到字段'functL1.reader.dmInstance'的基本实例!”

不是直观的,但是它指的是openSMILE期望配置中的cFunctional s 类型的配置部分functL1读取强制(子)字段functL1.reader.dmInstance,它然后找不到,因为部分(由于拼写错误)没有定义。

干杯, 弗洛里安