我使用http://msdn.microsoft.com/en-us/library/gg442302(v=vs.92).aspx中的基本方法来访问麦克风。但我试图检测特定声音的发生,如拍板。如何解释来自麦克风的流?缓冲区中的浮点数究竟代表什么?
由于
答案 0 :(得分:3)
我认为这可能有助http://en.wikipedia.org/wiki/Pulse-code_modulation。我认为某种方式的值代表了麦克风中机械部分与中间位置的偏移,但我确信理论和词汇可能会非常深入。
当谈到识别声音时 - 它也可能变得任意复杂,但是拍板可能是一个简单的任务 - 你基本上想要检测音量的突然增加,这会表现为音量的急剧增加。流中的绝对值的移动平均值,因此我在流上放置一个滑动窗口并继续检查某些阈值 - 一个用于高音量阈值的短窗口和两个相邻的,更长和更低的阈值窗口以确保在拍板前后没有这样的噪音。