所以我可以得到一个wav文件的所有字节的数组,我只想知道如何将原始声音数据解码为我可以用来判断歌手讲话时的内容/我的节拍(我不知道)知道正确的音乐术语,对不起)
如果有人可以链接我的API或教程,那就会膨胀,因为我似乎找不到任何好的东西。
答案 0 :(得分:0)
一般情况下,检测"事情发生时的情况"在一个波形文件中并不是人们可能想象的第一个想法。
可能的第一步是将.wav转换为所谓的"频谱图。" 我不认为Java有专门的API用于此目的,但谷歌搜索" java谱图"会给你一些第三方的例子。
我还发现this question可能是相关的。
P.S。我不是信号处理专家,所以欢迎更正。
答案 1 :(得分:0)
你会提前知道这个节拍吗?如果是这样,你可以cross correlate这两个信号,这个输出中的最高峰值对应于时间延迟。
除此之外,根据节拍开始前的声音,你可以转换到频域(通过FFT)并查看存在的频率,看看节拍开始时是否有重大变化
一些例子/额外细节会有所帮助。
如果您正试图检测所述节拍的节奏,请忽略所有我所说的大部分内容。