我将FFT应用于音频文件,显示播放音频文件时的频率。
是否有科学的方法来根据频率分布快照或一系列快照找到像欣快/悲伤/忧郁这样的情绪?
我的想法:
超过最高峰的约20%的特定阈值的最大值的数量大于或小于某个值导致欣快与否。理论上说,欣快的音乐部分通常伴随着很多和弦/不同的乐器,因此当同时播放许多不同的频率时,它很可能是欣快的。
虽然有很多误报。
答案 0 :(得分:1)
你想看看山峰与背景有多强烈的想法将会告诉你音乐是如何“嘈杂”与“倾斜”的,这可能会告诉你它是如何与乐器有关,尽管这种技术可能会误解其他的打击乐。各种噪音,如环境/环境噪音和声音效果。我认为这不会赢得你太多。
从FFT中,您还可以导出其他参数,如光谱质心,这与我们对亮度的感知密切相关,等等。
然而,单独的FFT并没有开始捕捉我们可能称之为音乐的“情绪”或“情感内容”。未捕获的一些信息示例:
答案 1 :(得分:0)