关于FFT和音高估计的几个问题

时间:2011-02-22 09:04:20

标签: fft estimation pitch

我总体上需要对FFT和音高估计进行一些澄清。

1。)我读到你的FFT块大小越大,它的准确度就越高,虽然我知道这也有不利之处。这是真的吗?因为我一直在尝试,每当我使用块大小16384而不是8192或4096时,我的结果会更差。有人可以澄清一下吗?

2。)最初,我认为从FFT获得音高只是获得具有最高强度的音箱的简单问题。但是,在这里发布和阅读一些问题之后,我认为可能会有更多这样的问题。有人可以建议我如何从FFT中获得良好的音高估计吗?

3。)虽然我已经有了一个好主意,但有人可以用简单的术语解释自相关算法的作用吗? (我的想法是它基本上是一个比较和对比算法,差异最小的算法是选择的算法)

非常感谢!

1 个答案:

答案 0 :(得分:1)

  1. 缺点是处理时间,内存消耗和延迟。如果你想要实时显示,在开始处理之前必须等待整个帧填满可能会花费不可思议的长时间。
  2. 是的,还有更多。具体来说,阶段。它也可以是具有最大负值(180度移位)的箱子,或者是零(90度移位)的箱子,或者介于两者之间的任何物品。您可能希望使用复数进行转换,并寻找最大的绝对值。
  3. 该算法通过测试信号与其自身的时移版本的“相似”程度来查找信号中的周期性元素。输出是从时间偏移到“相似性”的映射;然后,您可以寻找最高价值。