根据Spotify
documentation,'Timbre
'是从大约2秒的音频片段中提取的12个值的向量,如下所示:
"segments": [
{
(...),
"timbre": [
23.312,
-7.374,
-45.719,
294.874,
51.869,
-79.384,
-89.048,
143.322,
-4.676,
-51.303,
-33.274,
-19.037
]
}
],(...)
此段是随机选择的吗?即使在Echonest旧文档页面中,我也未找到有关如何选择此细分的任何信息。
我希望将此特征向量平均为更长的片段,例如30秒预览,以便尽可能准确地对音频进行分类。
是否可以使用Spotify Audio Analysis端点或我是否需要参考较大的项目,例如Million Song Project?