将音乐wav文件转换为文本符号

时间:2013-03-19 09:27:38

标签: fft pitch-tracking audio

我想提供一个音频wav文件(乐器 - 小提琴等)作为输入,我想检测所有的频率音调,并按照文本顺序进行更新,以便它们被播放。我想我应该定期使用fft光谱来获得它们的频率值。帮助我了解如何继续。

1 个答案:

答案 0 :(得分:3)

这是一个非常棘手的问题,您需要熟悉信号处理才能获得任何可用的结果。你是对的,FFT是一个很好的起点,但你应该阅读这里的一些其他帖子和网络上的论文。搜索“音高估计”。 '音高检测'或'音乐转录'。您需要了解复杂声音是如何由相关频率的多个正弦曲线(“谐波”)组成的,以及如何获得FFT的峰值不一定会给出音高(某些乐器具有基本频谱)频率(即音高)不是最大峰值。

Pitch Detection上的维基百科页面提供了一个很好的起点。我建议阅读一些关于自相关方法和谐波和频谱的论文。