我已经在吉他调谐器Java应用程序上工作了很长一段时间,并且最终设法获得音调(基频)检测,以使用FFT和谐波产品频谱准确地确定输入的基频。当我使用MacBook Pro的默认麦克风时,这非常有效,尽管信号有点嘈杂,但我最好使用我的外部USB音频声音接口(Lexicon Lambda)和直接插入的电吉他。我有尝试使用完全相同的代码,完全适用于麦克风输入,但检测到的音高是不同的。以下是我为每根琴弦检测到的基本原理结果(吉他已经调整好了)。
采样率= 8000
取样量= 16000
频率分辨率= 0.5Hz
E - Mic:82.5Hz - Lexicon Lambda:124.5Hz
A - 麦克风:110.0Hz - Lexicon Lambda:165.5Hz
D - 麦克:147.0Hz - Lexicon Lambda:221.5Hz
G - Mic:196.0Hz - Lexicon Lambda:293.5Hz
B - 麦克风:247.0Hz - Lexicon Lambda:371.0Hz
E - Mic:329.5Hz - Lexicon Lambda:495.0Hz
我对这些数字进行了一些讨论,似乎使用Lexicon Lambda发现的结果通常是准确结果大小的1.5倍。但不是仅仅添加这个额外的计算来得到正确的数字我想做到这一点,以便获得音频数据的两种方法都能返回准确的结果。
有没有人知道造成这种不一致的原因是什么?
修改
所以我很确定问题是由于Lambda使用了24位深度,而我的程序(和麦克风输入)的工作深度为16,而不仅仅是更改它来处理24比特数据,有没有人知道检测当前音频设备的可用比特深度的方法?
使用Lambda是优先考虑因素,因为信号噪音较小;然而,我刚刚尝试使用指定的24位深度工作,我得到IllegalArgumentException“没有行匹配接口TargetDataLine支持格式PCM_SIGNED 8000.0 Hz,24位,单声道,3字节/帧,小端得到支持。“我尝试使用44.1kHz也得到了相同的错误,这表明Lambda实际上并不使用24位音频,或者可能还有另一个问题。有没有人在Java Sound中使用24位音频有经验?似乎可能需要考虑更多,而不仅仅是改变位深度才能使其工作。
由于
答案 0 :(得分:3)
麦克风值是Lexicon Lambda的66%,例如E - Mic:329.5Hz除以Lexicon Lambda:495.0Hz =约0.66。不知道这是否重要?
麦克风的采样率和Lexicon Lambda的采样率是否相同?
钻头深度是否相同?我想知道它们是否不同,例如一个是16位,另一个是24位?这可能解释了计算中66%的值如何......
答案 1 :(得分:2)
第一个想法
样本比特率可能是关键!! 专业音频接口默认使用24位,16位是80的标准,在消费类电子产品中仍然使用很多。
如果您的FFT需要16位值并且您通过24位,那么您的声音将“拉伸”。 (想象一下正弦波使它更清晰)
这完全解释了频率漂移! 因此,您应该将24位转换为16位或重写FFT。
第二个想法
我在Lexikon网站上发现该接口仅支持44.1 kHz和48 kHz。 所以我猜Lambda默认设置为48 kHz。 如果您要求8 kHz采样率,接口无法处理,并且我认为保持在48 kHz。
因此,只需在两台设备上尝试常用的采样率,然后再进行比较。
答案 2 :(得分:0)
我有一个甜蜜的理论,但进一步认为它是完整的bs。在其他新闻中,我只想提一下,对于频率检测,FFT的精度远比麦克风样本的精度或噪声重要。麦克风上的量化噪声会在整个频谱上增加噪声,并且不会对FFT峰值产生太大影响,并且背景噪声也有望远远低于检测到的FFT峰值,并且不会对结果造成太大影响。
我在Android上有一个调谐器应用程序,我在FFT中使用定点优化,但结果很糟糕。另一方面,即使您远离手机和蹩脚的麦克风硬件,该应用也很有效,所以我认为您并不需要Lexicon的所有24位,只需确保您使用尽可能多的分辨率可能(最好是双倍)FFT乘法和加法。