我已经在StackOverflow和网络上搜索了很多关于口哨检测的问题,而且许多人确实解释了他们如何能够检测到他们的东西。
capturing sound for analysis and visualizing frequences in android
analyzing whistle sound for pitch note
但我没有得到的是FFT如何帮助您检测给定样本音频数据中的某些声音? 到目前为止,这是我在这里和那里找到的一些东西。
-The sine wave is more or less the building block of ALL signals, musical or not
-Three parameters - FREQUENCY, AMPLITUDE, and INITIAL PHASE, characterize every steady sine wave completely.
-They make each and any kind of wave unique.
-Fourier transform can be used to inspect what kinds of sine waves there are in a signal
SOURCE -- [Audio signal processing basics][3]
Audio data that the computer generates as received from the mic or other input source, for live processing, is an array of amplitudes processed (or stored or taken) at a particular sample rate.
那么如何从那个到检测口哨和鼓掌呢? 还有复杂的事情,例如,对特定歌曲的短暂吹哨?
我的检测理论是我们在一个视图中测试我们的口哨,并记录特定的频率和幅度特征。然后,如果在输入中再次重复这些特定特征,我们就会检测到哨声。 我是对还是错? 这种声音处理有点复杂。
忘了提这个 - 我正在使用Python。 Java也没关系,因为我发现的大多数示例代码都是用于Java的Android。我也可以在Java工作。任何提及任何库或API也会有所帮助。